是什么导致了 AttributeError："list"对象在使用 Tabula 绑定到 pdf 中读取时没有属性"read"？

我正在尝试使用Tabula从pdf中提取表信息并将其转换为熊猫数据帧。我一直在按照本教程中的步骤操作：

https://aegis4048.github.io/parse-pdf-files-while-retaining-structure-with-tabula-py

当我尝试使用以下代码(直接取自教程(将远程 PDF 加载到我的 jupyter 笔记本中时：

import tabula
df2 = tabula.read_pdf("https://github.com/tabulapdf/tabula-java/raw/master/src/test/resources/technology/tabula/arabic.pdf")

我收到错误：

属性

错误："列表"对象没有属性"读取">

我尝试阅读本地保存到我的机器的pdf，但出现相同的错误。我相信我已经成功安装了 Java 并正确配置了环境变量，并且我有最新版本的 Tabula。

链接到我的jupyter笔记本的屏幕截图：

https://www.dropbox.com/s/y44mfzuclihfdau/S_O_Capture_1.PNG?dl=0

谢谢。

确保您安装了正确的tabula软件包！

如果你运行pip3 install tabula，那么你安装了一个冒名顶替者！

运行pip3 uninstall tabula将其删除，然后运行：

pip3 install tabula-py

以安装正确的软件包。

相关内容