python pdf (PyPDF2模块)-如何拆分/合并此



我试图分割&合并PDF文件,这样我就可以删除每个PDF文件的第一页。代码如下:

    #python3
    #split and merge pdf files!

    import os, PyPDF2
    pdfFiles = []
    os.chdir('C:\Users\Cyber\Downloads\5-111-fall-2008\5-111-fall-2008\contents\readings-and-lecture-notes')

    for filename in os.listdir('.'):
        if filename.endswith('pdf'):
            pdfFiles.append(filename)
    pdfWriter = PyPDF2.PdfFileWriter()
    for filename in pdfFiles:
        pdfFileObj = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
        for pageNum in range(1, pdfReader.numPages):
            pageObj = pdfReader.getPage(pageNum)
            pdfWriter.addPage(pageObj)
    pdfOutput = open('Merged.pdf', 'wb')
    pdfWriter.write(pdfOutput)
    pdfOutput.close()

然后我得到以下错误…

: PdfReadWarning: Xref表不是零索引。物品的ID号将被更正。(pdf.py: 1736)

我搜索了这个错误,发现它表明PDF本身的创建可能有问题。

虽然我得到了我想要的合并。pdf文件,我想知道这到底是什么意思&如何避免它们。

此警告表示xref表的第一部分不是以对象0开始的。在写PDF时可能有错误。如果strict = False, PyPDF2将尝试更正对象ID号。如果strict = True,它们将不会被纠正。默认为True。尝试PyPDF2.PdfFileReader(pdfFileObj,False)

最新更新