Python3:模块'tabula'没有属性'read_pdf'



.py程序可以工作,但完全相同的代码在作为API公开时不工作。

该代码使用Tabula读取pdf,并将表内容作为输出提供。

我试过:

import tabula
df = tabula.read_pdf("my_pdf")
print(df)

from tabula import wrapper
df = wrapper.read_pdf("my_pdf")
print(df)

我在运行Ubuntu的AWS EC2上安装了tabula py(不是tabula(。

除了read_pdf,我实际上还想转换为CSV并给出输出。但这并不奏效。我得到了相同的无属性错误,即module 'tabula' has no attribute 'convert_into

.py文件和API文件(也是.py(位于同一目录中,由同一用户访问。

如有任何帮助,我们将不胜感激。

编辑:我尝试从API运行与OS命令(os.system("python3 /home/ubuntu/flaskapp/tabler.py")(相同的python文件。但效果并不理想。

确保您安装了tabula py而不仅仅是tabula使用

!pip install tabula-py

并使用导入

from tabula.io import read_pdf

常见问题解答中实际上有一个条目专门介绍了这个问题:

如果您安装了tabula,它将与命名空间冲突。应在删除tabula之后安装tabula-py

虽然从tabula.io使用read_csv()有效,但正如其他答案所建议的那样,在删除tabula并重新安装tabula-py(使用pip install --force-reinstall tabula-py(后,我也能够使用tabula.read_csv()

如果在安装tabula py之前意外安装了tabula,它们将在命名空间中发生冲突(即使在卸载tabula之后(。

卸载tabula py并重新安装它。这对我来说很有用。

tabula包有问题。我看了看里面,没有__init__.py。你可以做:

from tabula.io import read_pdf

它对我有效。

from tabula import read_pdf对我不起作用。我用tabula.io.read_pdf()替换了tabula.read_pdf()以使其起作用。

如果你在colab中工作,那么你必须通过命令安装它

!pip安装-q表格py导入表格

对于使用read_pdf和convert_into这样的函数,我们必须使用dfs=tabula.io.read_pdf(路径,流=True(

注意-tabula.io(应用于访问colab中的这些功能(有一个美好的一天和长寿的数据科学社区。

尝试

from tabula import read_pdf

我也有同样的问题,这解决了它。

它是这样工作的:

import tabula # just this here!
#declare the path of your file
file_path = "/path/to/pdf_file/data.pdf"
#Convert your file
df = tabula.io.read_pdf(file_path)

泰国就是全部!

最新更新