如何使用java获取pdf的行数



我需要使用java获取pdf文件中的行数。

我使用itext-2.1.7.jar来获取页数。

有办法得到pdf.

的行数吗?

没有简单的方法可以做到这一点,只有近似。这个问题是,pdf页面是一个画布,在任意位置都有绘图,其中一些恰好是字体和文本。

一种方法是提取文本,并从文本位置构建一个列表,其中包含您将视为一行的内容。使用LocationTextExtractionStrategy来得到这个结果,但你必须使用最新的jar, itext 2.1.7太旧了,不能很好地进行文本提取。

最新更新