我有以下脚本将几个PDF合并在一起:
import PyPDF2
import sys
import os
inputs = sys.argv[1]
list = os.listdir(inputs)
merger = PyPDF2.PdfFileMerger()
for pdf in list:
merger.append(pdf)
merger.write('merged.pdf')
print('All done')
包含文件的文件夹与正在运行的脚本位于不同的目录中,因此我插入了完整路径。
从终端这样运行时,python3 pdf-merger.py /Users/user/Documents/pdf_list
,我收到以下错误:
Traceback (most recent call last):
File "pdf-merger.py", line 11, in <module>
merger.append(pdf)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/PyPDF2/merger.py", line 203, in append
self.merge(len(self.pages), fileobj, bookmark, pages, import_bookmarks)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/PyPDF2/merger.py", line 114, in merge
fileobj = file(fileobj, 'rb')
FileNotFoundError: [Errno 2] No such file or directory: 'card.pdf'
我还尝试了另一种方法:
import PyPDF2
import sys
import os
inputs = sys.argv[1]
list = [os.path.join(inputs,a) for a in os.listdir(inputs)]
merger = PyPDF2.PdfFileMerger()
for pdf in list:
merger.append(pdf)
merger.write('merged.pdf')
print('All done')
这次我得到了一个PyPDF2.utils.PdfReadError: Could not read malformed PDF file
,不管它是什么文件。
有什么想法吗?
发现问题。目录中有一个隐藏的.DS_Store
文件,该文件损坏了脚本。
忽略它if pdf.endswith('.pdf')
解决了问题!