小贝子编程

如何在Python中逐行从Pdf中提取文本

我没有得到任何解决方案，我们有选项可以使用Pypdf提取整个文本，但我想逐行提取文本。任何帮助将不胜感激。谢谢

如果你使用的是 Ubuntu，你可以做这样的事情：

$ less <file_name>.pdf >op.txt

并首先将 PDF 中的文本重定向到文本文件，然后使用 Python 代码逐行读取：

f=open("op.txt",'r')
for line in f:
    line=line.strip('n')
    print(line)
f.close()

最新更新