我有 2 个 excel 文件,我想比较内容并突出显示差异。例如:
第一个文件...
name|age
abc|123
def|456
second file...
name|age
abc|123
def|456
ghi|789 - this being the differece
是否有任何第三方库可以执行此操作?或者最好的方法是什么?
就像DaDaDom说Apache POI是你正在寻找的。您可以从此页面下载它。请注意,POI 项目不是完全独立的,您可能需要下载一些额外的库。按照 Apache POI 网站上的说明进行操作。这是您使用它的方式:
InputStream myxls = new FileInputStream("workbook.xls"));
HSSFWorkbook wb = new HSSFWorkbook(myxls); // for *.xlsx use XSSFWorkbook
如果是新文件,您可能需要在继续之前创建工作表,但在这种情况下,文件已经创建。
HSSFSheet sheet = wb.getSheetAt(0); // first sheet
HSSFRow row = sheet.getRow(0); // first row
HSSFCell cell = row.getCell((short)0); // first cell
要从单元格中获取值,请使用:
String value = cell.getStringCellValue();
但是,如果存储在单元格中的类型是数字,则会收到错误。如果是数字,请使用:
Int value = cell.getCellValue();
这是我编写的用于处理不同单元格数据类型的方法:
public String getValue(int x, int y){
Row row = this.activeSheet.getRow(y);
if(row==null) return "";
Cell cell = row.getCell(x);
if(cell==null) return "";
int type = cell.getCellType();
switch(type){
case 0:
return cell.getNumericCellValue() + "";
case 1:
return cell.getStringCellValue();
case 2:
return cell.getCellFormula();
case 3:
return "";
case 4:
return cell.getBooleanCellValue() + "";
case 5:
return cell.getErrorCellValue() + "";
default:
return "";
}
}
我希望这个对Apache POI的快速介绍能帮助你完成项目:)
从这个问题来看,我的答案在下面部分重复。
我的项目simple-excel提供了一堆Hamcrest Matchers并包装了Apache POI的语法。
当您执行以下操作时,
assertThat(actual, WorkbookMatcher.sameWorkbook(expected));
例如,你会看到,
java.lang.AssertionError:
Expected: entire workbook to be equal
but: cell at "C14" contained <"bananas"> expected <nothing>,
cell at "C15" contained <"1,850,000 EUR"> expected <"1,850,000.00 EUR">,
cell at "D16" contained <nothing> expected <"Tue Sep 04 06:30:00">
at org.hamcrest.MatcherAssert.assertThat(MatcherAssert.java:20)
阅读有关它的博客文章
我会使用 epplus 将两个文档加载到数据表中,然后迭代它们以查找差异。根据您希望如何突出显示差异,您可以简单地使用 epplus 为单元格着色并将它们保存回文件中。