的行数吗?
我需要使用java获取pdf文件中的行数。
我使用itext-2.1.7.jar
来获取页数。
有办法得到pdf.
没有简单的方法可以做到这一点,只有近似。这个问题是,pdf页面是一个画布,在任意位置都有绘图,其中一些恰好是字体和文本。
一种方法是提取文本,并从文本位置构建一个列表,其中包含您将视为一行的内容。使用LocationTextExtractionStrategy
来得到这个结果,但你必须使用最新的jar, itext 2.1.7太旧了,不能很好地进行文本提取。