小贝子编程

从pdf文件中获取所有页码以输出时遇到麻烦

本文关键字：输出麻烦遇到文件 pdf 获取 python pypdf
更新时间 : 2024-03-20
英文 : Having trouble getting all the page numbers from a pdf file to output

我无法从pdf文件中获取所有页码。这是我的代码!我只得到一个页码，输出我试图从我的pdf文件中得到所有页码。我如何修复我的代码，以获得所有的pdf页码?总共有20页。
输入图片描述

我的尝试看起来像这样:

import PyPDF2
pdffileobj = open('test.pdf','rb')
pdfreader = PyPDF2.PdfFileReader(pdffileobj)
#extract the number of pages in the pdf and all text from the pdf
data = ''
#extract the text from the pdf
for i in range(pdfreader.numPages):
pageobj = pdfreader.getPage(i)
data += pageobj.extractText()

参见https://pypdf2.readthedocs.io/en/latest/user/extract-text.html

from PyPDF2 import PdfReader
reader = PdfReader("example.pdf")
for page in reader.pages:
print(page.extract_text())
print(f"pdf page count : {len(reader.pages)}")

从pdf文件中获取所有页码以输出时遇到麻烦

相关内容

最新更新

热门标签：