我试图分割&合并PDF文件,这样我就可以删除每个PDF文件的第一页。代码如下:
#python3
#split and merge pdf files!
import os, PyPDF2
pdfFiles = []
os.chdir('C:\Users\Cyber\Downloads\5-111-fall-2008\5-111-fall-2008\contents\readings-and-lecture-notes')
for filename in os.listdir('.'):
if filename.endswith('pdf'):
pdfFiles.append(filename)
pdfWriter = PyPDF2.PdfFileWriter()
for filename in pdfFiles:
pdfFileObj = open(filename, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
for pageNum in range(1, pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open('Merged.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()
然后我得到以下错误…
: PdfReadWarning: Xref表不是零索引。物品的ID号将被更正。(pdf.py: 1736)
我搜索了这个错误,发现它表明PDF本身的创建可能有问题。
虽然我得到了我想要的合并。pdf文件,我想知道这到底是什么意思&如何避免它们。
此警告表示xref表的第一部分不是以对象0开始的。在写PDF时可能有错误。如果strict = False, PyPDF2将尝试更正对象ID号。如果strict = True,它们将不会被纠正。默认为True。尝试PyPDF2.PdfFileReader(pdfFileObj,False)