从python中的PDF中提取戳记为jpg



我遇到了一个问题。我需要从pdf中提取的一些图像并不是图像到pdf,而是Stamp。我得到了很多PDF,我想从这些PDF中提取所有邮票和所有图像(我有一个所有图像的脚本,但不是所有邮票的脚本(。我只想要这些邮票的JPG,但我不知道如何解析这些PDF并以JPG格式提取所有邮票。我想在python 3中做到这一点。

非常感谢!问候,

使用use或pyMuPDF,您可以执行以下操作:

#!/usr/bin/python
import fitz
pdf_document = fitz.open("file.pdf")

for current_page in range(len(pdf_document)):
for annot in pdf_document[current_page].annots():
xref = annot.get_pixmap()
xref.writePNG("page%s-%s.png" % (current_page, xref))

最新更新