小贝子编程

有没有办法使用 tesseract OCR 引擎加速提取，而 tiff 文件有 600-700 页

本文关键字：tiff 文件 600-700 提取加速 tesseract 引擎 OCR 有没有 tesseract tiff libtiff
更新时间 : 2023-09-05
英文 : Is there any way to speed up extraction using tesseract OCR Engine, while tiff file is having 600-700 pages?

在处理 tiff 文件的过程中，这些文件有 600 - 700 页来自带有 hocr 选项的 Tesseract OCR 引擎，我们监控文件大约需要 40 - 50 分钟。

我们监控到处理大文件的时间太多了。

我们有什么办法可以加快这一进程吗？

以下命令正在使用：-

<Drive>:Tesseract-OCR>tesseract.exe "Source_Tiff_File" "Destination_File" hocr

您可以拆分多页 TIFF 并在多个进程中运行它们。

最新更新

为什么"需要'原生'"在 opalrb 中抛出异常？
c -结构体中char指针的内存分配
Azure功能应用程序与自托管集成运行时相结合
类型 'String' 不是类型转换中 'List<String>' 类型的子类型？
__init__是一个类属性吗?
如何格式化LocalDateTime yyyy-MM-dd HH:mm到dd-MM-yyyy HH:mm作为字符串的整个
为什么客户端组件不工作- NextJS 13.3.0实验特性
跨行扩展字典，维护其他列- python
如何将open()加载的数据编码为UTF-8?
这个Golang程序中的同步问题
如何使用Caliburn在MVVM中重用新视图.微观和微观
如何np.用张量连接列表?
基于文件名移动文件
Toast消息不显示当我点击按钮
r语言 - 如何在环境中运行任意表达式，并将所有结果存储在环境中?
Picutre 未显示在警报对话框中
如何在SQL Server中赋予用户CREATE DATABASE的权限?
选项importsNotUsedAsValues已弃用
在c# WinForms中不维护更改鼠标指针
Rust执行类型转换在运行时或在编译静态?
我如何在log4net中指定一个绝对文件路径，使用datePattern?
如何在服务端使用pubnub w/ nodejs作为服务，并从不同的客户端连接到该nodejs服务器
用下划线替换其中任意一个字符
Typescript在访问映射的Proxy对象时丢失了键类型的特定性
r语言 - 时间序列由长到宽
如何获得Traefik的dnsChallange的"www.*.example.org"证书？
用Rxjs构建一个初始化器
我在JavaScript文件变量中定义html代码的一部分时出错
嵌入式Jetty服务器的JNDI查找失败
是否可以在构造函数的成员初始化列表中使用结构化绑定?

有没有办法使用 tesseract OCR 引擎加速提取，而 tiff 文件有 600-700 页

相关内容

最新更新

热门标签：