FileNotFound 错误 / 使用 PyPDF2 和 os.listdir() 读取 PDF 文件



我有以下脚本将几个PDF合并在一起:

import PyPDF2
import sys
import os
inputs = sys.argv[1]
list = os.listdir(inputs)
merger = PyPDF2.PdfFileMerger()
for pdf in list:
merger.append(pdf)
merger.write('merged.pdf')
print('All done')

包含文件的文件夹与正在运行的脚本位于不同的目录中,因此我插入了完整路径。

从终端这样运行时,python3 pdf-merger.py /Users/user/Documents/pdf_list,我收到以下错误:

Traceback (most recent call last):
File "pdf-merger.py", line 11, in <module>
merger.append(pdf)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/PyPDF2/merger.py", line 203, in append
self.merge(len(self.pages), fileobj, bookmark, pages, import_bookmarks)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/PyPDF2/merger.py", line 114, in merge
fileobj = file(fileobj, 'rb')
FileNotFoundError: [Errno 2] No such file or directory: 'card.pdf'

我还尝试了另一种方法:

import PyPDF2
import sys
import os
inputs = sys.argv[1]
list = [os.path.join(inputs,a) for a in os.listdir(inputs)]
merger = PyPDF2.PdfFileMerger()
for pdf in list:
merger.append(pdf)
merger.write('merged.pdf')
print('All done')

这次我得到了一个PyPDF2.utils.PdfReadError: Could not read malformed PDF file,不管它是什么文件。

有什么想法吗?

发现问题。目录中有一个隐藏的.DS_Store文件,该文件损坏了脚本。

忽略它if pdf.endswith('.pdf')解决了问题!

最新更新