小贝子编程

从python中的PDF中提取戳记为jpg

本文关键字：记为 jpg 提取 python 中的 PDF python pdf extract jpeg stamp
更新时间 : 2023-09-20
英文 : Extract stamp from PDF in python as jpg

我遇到了一个问题。我需要从pdf中提取的一些图像并不是图像到pdf，而是Stamp。我得到了很多PDF，我想从这些PDF中提取所有邮票和所有图像(我有一个所有图像的脚本，但不是所有邮票的脚本(。我只想要这些邮票的JPG，但我不知道如何解析这些PDF并以JPG格式提取所有邮票。我想在python 3中做到这一点。

非常感谢！问候，

使用use或pyMuPDF，您可以执行以下操作：

#!/usr/bin/python
import fitz
pdf_document = fitz.open("file.pdf")

for current_page in range(len(pdf_document)):
for annot in pdf_document[current_page].annots():
xref = annot.get_pixmap()
xref.writePNG("page%s-%s.png" % (current_page, xref))

最新更新

是否有一个顺序Java正则表达式?
如何向右移动一个字符串n个字符
我应该从存储库返回任务<IEnumerable<T>>还是IAsyncEnumerable<T>？
Python处理程序错误-没有足够的值来解包
使用 javascript 获取最接近和最高的 id
如何利用向量化技术提高MATLAB程序的效率
如何将PostgreSQL查询转换为LINQ或lambda表达式
Python mysql-connector-python:如何使用mysql-connector-python从终端连
新的json数据不显示在android
如果不同时更改当前头像，则无法更新用户详细信息
Kotlin HTTP GET 数据并插入到文本视图中
滑块在移动设备上不跟随手指
释放WKNavigationAction子类在iOS 15上崩溃
gst_video_time_code_is_valid在向流添加时间码时断言失败
如何杀死Mac上每次重新启动的进程?
CMake：如何防止'target_link_libraries'将Visual Studio项目引用添加到静态库中？
飞镖编码/解码类不起作用
ADF - Dynamic Sheet
无法使用处理程序保存图像。 "Physical path, but a virtual path was expected."
在挂载/卸载组件之间重用WebGL上下文
可以从Azure Blob Storage下载文件
Flutter:选中复选框时如何更改标题:TextStyle ?
为什么在反应中手动改变状态是一个反模式?
我们如何从"git 日志"中排除"由'git notes add'添加的注释"？
Python递归函数背后的逻辑
numpy数组大小改变，可能表示二进制不兼容
如何在另一个选择菜单中使用来自一个选择菜单的消息
如何转换int值从csv到datetime在Spark SQL?
如何在同一行中添加输入和按钮
让加密403错误当在遗留(EOL)上安装certbot-auto时需要SNI错误

从python中的PDF中提取戳记为jpg

相关内容

最新更新

热门标签：