使用 POI 事件模型读取 Excel 文件



我想使用 Apache POI 的 HSSF EventModel 读取 Excel 文件(.xls 格式)。我的 excel 工作表是一个简单的 excel 文件,没有宏。只是想知道我必须处理哪些类型的记录。

以下是Excel文件中的数据类型:-

    1. String
    2. Boolean
    3. Number
    4. Date.

我找到了这些布尔错误,空白,数字。让我知道我还需要处理哪些记录。

谢谢斯里尼瓦桑

如果您希望数字和日期像在Excel中一样显示,则需要所有单元格格式信息。这是因为数字和日期单元格的存储方式相同,因为浮点数每条记录一个单元格(MulRks 周围的少数特殊情况除外),并且只有格式规则才能告诉您它是日期还是数字以及如何显示它们。

我建议您查看使用 HSSF 事件模型进行基于事件的.xls文件提取的两个优秀示例。第一个是在POI本身,EventBasedExcelExtractor,它提供纯文本输出。第二个是Apache Tika,ExcelExtractor,它提供了一个XHTML版本

在这两种情况下,你将看到仅注册和处理几个记录 SID 的代码,并且还将看到它们的用途。您还将了解如何在使用事件模型时访问 POI 的格式代码,您需要使用该代码来使您的数字和日期看起来正确。

您可能还想查看另一个 POI 示例 XLS2CSVmra,它展示了如何处理未使用的行和单元格通常不会显示在 Excel 文件中的事实。对于文本提取,这不是问题,但对于CSV导出之类的事情,知道缺少单元格或行,以及数量是关键!

最新更新