如何修复"无法从"pdfminer.pdfinterp"错误导入名称'process_pdf'



我正在尝试将pdf文件中的文本转换为文本或HTML格式,但是此错误经常发生'无法从'pdfminer.pdfinterp'导入名称'process_pdf'我怎样才能删除它?

我已经在Visual Basic studio中尝试了这段代码,但它仍然不起作用,但是在这种情况下,由于空格,我遇到了缩进错误,所以我在jupyter笔记本中尝试了这个并得到了这个错误。

from io import StringIO
from pdfminer.pdfinterp import PDFResourceManager , process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layput import LAParams

def to_txt(pdf_path):
    input_ = file(pdf_path , 'rb')
    output = StringIO()
    manager = PDFResourceManager()
    converter = TextConverter(manager, output, laparams = LAParams())
    process_pdf(manager, converter, input_)
    return output.getvalue()
b = to_txt(rb"C:UsersJasvinder SinghDesktopHACK-IN REPORT.docx")
ImportError: cannot import name 'process_pdf' from 'pdfminer.pdfinterp' (C:UsersJasvinder SinghAnaconda3libsite-packagespdfminerpdfinterp.py)

请参阅文档和对错误的评论。

process_pdf方法已替换为 PDFPage.get_pages()

相关内容

  • 没有找到相关文章