Running pdftotext from Python

我正在尝试使用pdftotext软件将pdf文档转换为文本文档。

我需要从python脚本调用这个应用程序inc命令提示符来转换文件。

我有以下代码:

import os 
import subprocess
path = "C:\Users\..." 
pdffname = "pdffilename.pdf" 
txtfname = "txtfilename.txt"
subprocess.call(['pdftotext', '-layout', 
     os.path.join(path, pdffname),
     os.path.join(path, txtfname)])

当我运行这段代码时，我得到错误

  File "C:/Users/.../code-1.py", line 44, in <module>
    os.path.join(path, txtfname)])
  File "C:Anacondalibsubprocess.py", line 522, in call
    return Popen(*popenargs, **kwargs).wait()
  File "C:Anacondalibsubprocess.py", line 710, in __init__
    errread, errwrite)
  File "C:Anacondalibsubprocess.py", line 958, in _execute_child
    startupinfo)
WindowsError: [Error 2] The system cannot find the file specified

你可以帮助调用pdftotext应用程序从python转换pdf到文本文件

我也有同样的错误，除了Popen。我通过在子进程调用中提供pdftotext.exe的完整路径来修复它。别忘了转义你的反斜杠。

我对Anaconda不太了解，我自己也没有测试过，但我相信Conda在Windows上引用脚本可能有问题:修复对Windows上脚本的引用

相关内容

最新更新

热门标签：