python和tabula的新手。我试图将PDF文件转换为csv,但在使用read_PDF时遇到了问题。我一直收到一个java错误。如有任何意见或建议,我们将不胜感激。
import PyPDF2
import tabula
from tabula import read_pdf
*代码插入和修改我的pdf
df = read_pdf("test.pdf", pages=1)
我得到的错误如下:
收到标准错误:2020年4月2日下午10:19:52 org.apache.pdfbox.rendering.PDFRender suggestKCMS
信息:您当前的java版本是:1.8.0_25
2020年4月2日下午10:19:52 org.apache.pdfbox.rendering.PDF投标人建议KCMS
信息:为了在旧的java 1.8或9版本上获得更高的渲染速度,
2020年4月2日下午10:19:52 org.apache.pdfbox.rendering.PDF投标人建议KCMS
信息:更新到最新的1.8或9版本(>=1.8_191或>=9.0.4(,
2020年4月2日下午10:19:52 org.apache.pdfbox.rendering.PDF投标人建议KCMS
信息:或
2020年4月2日下午10:19:52 org.apache.pdfbox.rendering.PDF投标人建议KCMS
信息:使用选项-Dsun.java2d.cmm.kcms.KcmsServiceProvider
2020年4月2日下午10:19:52 org.apache.pdfbox.rendering.PDF投标人建议KCMS
信息:或调用System.setProperty("sun.java2d.cmm","sun.jjava2d.cmm.kcms.KcmsServiceProvider"(
这不是错误,是记录tabula-java
库的输出,tabula
Python库使用该库。