小贝子编程

如何在Python中将扫描的PDF转换为可搜索的PDF?[环境:Windows]

本文关键字：PDF 搜索环境 Windows 转换 Python 扫描 python python-3.x pdf text scanning
更新时间 : 2023-09-21
英文 : How to convert scanned PDF to searchable PDF in Python? [Environment:Windows]

我已经扫描了pdf，我只想用python转换可搜索的pdf。我可以在Abode上转换，但我想通过程序进行转换，而且它应该是开源的。有人能帮忙转换PDF吗？

注意：它不应该删除PDF上的任何图像。

我已经通过使用wand包解决了这个问题。示例代码：

from pdf2image import convert_from_path
from wand.image import Image as WandImage
TIFFPdf = convert_from_path(pdfFileName)
pageNumber = 0
for img in TIFFPdf:
pageNumber = pageNumber + 1

img1 = WandImage()
img1.read(filename='suresh.pdf' + '[' + str(pageNumber) + ']', resolution=300)
img1.compression = 'group4'
img1.save(filename=str(pageNumber) + '.tif')

最新更新

Python处理程序错误-没有足够的值来解包
使用 javascript 获取最接近和最高的 id
如何利用向量化技术提高MATLAB程序的效率
如何将PostgreSQL查询转换为LINQ或lambda表达式
Python mysql-connector-python:如何使用mysql-connector-python从终端连
新的json数据不显示在android
如果不同时更改当前头像，则无法更新用户详细信息
Kotlin HTTP GET 数据并插入到文本视图中
滑块在移动设备上不跟随手指
释放WKNavigationAction子类在iOS 15上崩溃
gst_video_time_code_is_valid在向流添加时间码时断言失败
如何杀死Mac上每次重新启动的进程?
CMake：如何防止'target_link_libraries'将Visual Studio项目引用添加到静态库中？
飞镖编码/解码类不起作用
ADF - Dynamic Sheet
无法使用处理程序保存图像。 "Physical path, but a virtual path was expected."
在挂载/卸载组件之间重用WebGL上下文
可以从Azure Blob Storage下载文件
Flutter:选中复选框时如何更改标题:TextStyle ?
为什么在反应中手动改变状态是一个反模式?
我们如何从"git 日志"中排除"由'git notes add'添加的注释"？
Python递归函数背后的逻辑
numpy数组大小改变，可能表示二进制不兼容
如何在另一个选择菜单中使用来自一个选择菜单的消息
如何转换int值从csv到datetime在Spark SQL?
如何在同一行中添加输入和按钮
让加密403错误当在遗留(EOL)上安装certbot-auto时需要SNI错误
C对文本文件中的整数进行选择排序，并将排序后的数字写入新文件
如何使Java Rest API在处理前半部分后返回响应，然后在返回响应后继续后半部分?
SvelteKit未看到[id].苗条的文件

如何在Python中将扫描的PDF转换为可搜索的PDF?[环境:Windows]

相关内容

最新更新

热门标签：