Java pdf小丑vs apache pdf盒子



我寻找一个免费的Java库来分析商业程序中的pdf。

通过计算不同的单词和检测标题,哪个库更好地在pdf中进行数据挖掘?

PDFBox将成为一个很棒的pdf Java库。目前,最新版本还不稳定,但提供了很好的解决方案。文档是可爱的,所以如果你想做简单的事情,你不会浪费太多的时间来学习。

最新更新