Java花式处理EXCEL
批量处理1——文件的上传(bootstrap+Ajax+SSM)
批量处理2——Java花式处理EXCEL
批量处理3——Excel文件导出
批量处理4——java处理压缩文件
Java知多少——相对路径和绝对路径
HTTP知多少——Content-disposition(文件下载)
java批量处理专题——用户将Excel上传到服务器,服务器如何解析Excel并将其解析为java对象?
推荐阅读:解析EXCEL的API方法
1. 简单API介绍
1.1 workbook工作空间
由于Excel存在xls以及xlsx两种格式,所以创建方式也有所不同。
- 对于xls格式,需要使用HSSFWorkbook来创建对象;
- 对于xlsx格式,需要使用XSSFWorkbook来创建工作薄;
需要注意HSSFWorkBook与XSSSFWorkbook两个类都是Workbook接口的实现类。
String extString = filePath.substring(filePath.lastIndexOf("."));
InputStream is = null;
try {
is = new FileInputStream(filePath);
if (".xls".equals(extString)) {
wb = new HSSFWorkbook(is);
} else if (".xlsx".equals(extString)) {
wb = new XSSFWorkbook(is);
} else {
throw new BusinessException("文件格式错误");
}
首先,我们获取到文件后缀名,然后创建FileInputStream文件输入流。然后,根据文件格式的不同,选择不同的workbook
。
1.2 Sheet
看到Excel模型中的sheet1(页面)了吗。其实就是定位到当前sheet进行处理的。
同样的创建Sheet的时候,也存在HSSFSheet和XSSFSheet这两种类型。所有我们使用其父类Sheet去处理对应的子类实现。
获取第一个sheet空间:
sheet = wb.getSheetAt(0);
1.3 Row
作用是定位到特定的行。
getPhysicalNumberOfRows和getLastRowNum的区别这两个方法都是判断sheet是否有数据。
区别:
sheet.getPhysicalNumberOfRows()
:返回物理定义的行数(不是工作表中的行数)sheet.getLastRowNum()
:返回此sheet中最后一行的数字编号,默认是从0开始。
sheet = wb.getSheetAt(0);
//获取sheet中,有数据的行数
int rownum = sheet.getPhysicalNumberOfRows();
//因为模板是在第四行开始读取,那么我们的直接定位到第四行
for (int i = 4; i < rownum; i++) {
//获取当前行
Row row = sheet.getRow(i);
if (row != null) {
//开始对cell进行处理。
}
}
1.4 Cell
定位到特定的表格
获取到cell上的数据,进行“业务处理”,当然不同的业务逻辑不同,这里写几个特殊的处理方法。
1. 获取cell上的值,下标从0开始
Cell cell= row.getCell(int index);
2. 判断Cell的单元格格式
单元格格式的枚举类型
public interface Cell {
public final static int CELL_TYPE_NUMERIC = 0;
public final static int CELL_TYPE_STRING = 1;
public final static int CELL_TYPE_FORMULA = 2;
public final static int CELL_TYPE_BLANK = 3;
public final static int CELL_TYPE_BOOLEAN = 4;
public final static int CELL_TYPE_ERROR = 5;
}
获取单元格的类型
int type1 = cell.getCellType();
if(type1==Cell.CELL_TYPE_STRING){
//TODO
}
判断单元格是否为空
if (cell == null || org.apache.commons.lang3.StringUtils.isBlank(cell.getStringCellValue())) {
failMap.put(i, "xx为空");
break;
}
设置单元格格式
cell.setCellType(Cell.CELL_TYPE_STRING);
若是文本格式,获取单元格里面的值
在批量上传的时候,推荐模板的单元格格式为文本模式。
cell.getStringCellValue();
如此一来,我们可以将Excel表格里面的数据全部解析出来。
2. 实战中的使用
当然,简单的API可以完成解析的,但是如何在项目中使用呢?
需求:对Excel处理完毕之后,需要记录成功多少笔,失败多少笔。
1. 用户点击上传成功之后,点击前端进行验证:
(1)创建List
对象,将解析成功的Excel数据组装成对象保存在集合中;
(2)创建Map
对象,保存解析失败的原因和row位置;
解析原文件
调用filePaserExcel(解析成功的对象,目标文件,解析成功Map,解析失败的Map)方法,解析Excel对象。
public int fileParseExcel(List<CliBatchWithdraw> successUser, File file,Map<Integer, String> rowSucMap, Map<Integer, String> failMap){
String filePath = file.getAbsolutePath();
if (filePath == null) {
throw new BusinessException("文件路径为空");
}
String extString = filePath.substring(filePath.lastIndexOf("."));
InputStream is = null;
int count = 0;
try {
//获取WorkBook对象
is = new FileInputStream(filePath);
if (".xls".equals(extString)) {
wb = new HSSFWorkbook(is);
} else if (".xlsx".equals(extString)) {
wb = new XSSFWorkbook(is);
} else {
throw new BusinessException("文件格式错误");
}
int count = 0;
if (wb != null) {
//获取sheet对象
sheet = wb.getSheetAt(0);
//获取Sheet中的实际行
int rownum = sheet.getPhysicalNumberOfRows();
String type = "";
//在第四行进行解析
for (int i = 4; i < rownum; i++) {
Row row = sheet.getRow(i);
if (row != null) {
User user= new User();
//获取第一个单元格
Cell userId= row.getCell(0);
//默认模板已经是文本格式的
if (userId== null || org.apache.commons.lang3.StringUtils.isBlank(userId.getStringCellValue())) {
//因为sheet可能存在空白行,所以判断第一列为空则代表Excel遍历完毕
failMap.put(i, "用户为空");
break;
}
userId.setCellType(Cell.CELL_TYPE_STRING);
//每遍历完一行,count++
count++;
Cell age = row.getCell(1);
if (age == null || org.apache.commons.lang3.StringUtils.isBlank(age .getStringCellValue())) {
failMap.put(i, "年龄为空");