我没有得到任何解决方案,我们有选项可以使用Pypdf
提取整个文本,但我想逐行提取文本。任何帮助将不胜感激。谢谢
如果你使用的是 Ubuntu,你可以做这样的事情:
$ less <file_name>.pdf >op.txt
并首先将 PDF 中的文本重定向到文本文件,然后使用 Python 代码逐行读取:
f=open("op.txt",'r')
for line in f:
line=line.strip('n')
print(line)
f.close()