.py
程序可以工作,但完全相同的代码在作为API公开时不工作。
该代码使用Tabula读取pdf,并将表内容作为输出提供。
我试过:
import tabula
df = tabula.read_pdf("my_pdf")
print(df)
和
from tabula import wrapper
df = wrapper.read_pdf("my_pdf")
print(df)
我在运行Ubuntu的AWS EC2上安装了tabula py(不是tabula(。
除了read_pdf,我实际上还想转换为CSV并给出输出。但这并不奏效。我得到了相同的无属性错误,即module 'tabula' has no attribute 'convert_into
。
.py文件和API文件(也是.py(位于同一目录中,由同一用户访问。
如有任何帮助,我们将不胜感激。
编辑:我尝试从API运行与OS命令(os.system("python3 /home/ubuntu/flaskapp/tabler.py")
(相同的python文件。但效果并不理想。
确保您安装了tabula py而不仅仅是tabula使用
!pip install tabula-py
并使用导入
from tabula.io import read_pdf
常见问题解答中实际上有一个条目专门介绍了这个问题:
如果您安装了
tabula
,它将与命名空间冲突。应在删除tabula
之后安装tabula-py
。
虽然从tabula.io
使用read_csv()
有效,但正如其他答案所建议的那样,在删除tabula
并重新安装tabula-py
(使用pip install --force-reinstall tabula-py
(后,我也能够使用tabula.read_csv()
。
如果在安装tabula py之前意外安装了tabula,它们将在命名空间中发生冲突(即使在卸载tabula之后(。
卸载tabula py并重新安装它。这对我来说很有用。
tabula包有问题。我看了看里面,没有__init__.py。你可以做:
from tabula.io import read_pdf
它对我有效。
from tabula import read_pdf
对我不起作用。我用tabula.io.read_pdf()
替换了tabula.read_pdf()
以使其起作用。
如果你在colab中工作,那么你必须通过命令安装它
!pip安装-q表格py导入表格
对于使用read_pdf和convert_into这样的函数,我们必须使用dfs=tabula.io.read_pdf(路径,流=True(
注意-tabula.io(应用于访问colab中的这些功能(有一个美好的一天和长寿的数据科学社区。
尝试
from tabula import read_pdf
我也有同样的问题,这解决了它。
它是这样工作的:
import tabula # just this here!
#declare the path of your file
file_path = "/path/to/pdf_file/data.pdf"
#Convert your file
df = tabula.io.read_pdf(file_path)
泰国就是全部!