小贝子编程

使用tika库从java中的图像中提取文本

本文关键字：图像提取取文本使用库从 java tika java ocr apache-tika
更新时间 : 2023-08-31
英文 : Extract text from image in java using tika library

我需要从图像中提取文本，所以我发现很少有OCR库

Tes4j

这不起作用，所以我搬到了apache tika。

在apache tika中，我尝试了ImageParser和JpegParser。它提供了文件信息，但没有在我的图像文件中提供文本。

您也可以从命令行运行tika。只在您想要执行OCR的图像上运行它：

java -jar ./tika-app/target/tika-app-1.13-SNAPSHOT.jar -t ~/Desktop/tess.png

Tika在内部使用tesseract来执行OCR。所以你应该把它安装在你的PATH上。

对于图像处理，Tessaract是最好的api，它与java一起提供了一些方法，请尝试一下。您可以在此处找到更多详细信息

最新更新

为什么当我尝试在 TypeScript 中导入/实现接口时遇到"Cannot find name '...'.ts(2304)"？
Python 导入未安装/找不到
在fortran中是否有任何方法可以从外部定义实4或实8 ?
在SwiftUI, iOS15，二级导航链接，isActive不工作
如何添加自定义字体到现有的PDF文件?
按步进循环中的切片列表
用外部程序处理REST请求的最佳方式
如何继承查看属于GCP组织的所有项目的访问权限?
如何在任何Jetpack撰写视图上禁用涟漪效应?
如何比较数额与PHP库砖/钱
c -从主线程触发一个线程中的动作的防弹方式?
"AttributeError： 'VendorAlias' 对象没有属性 'find_spec'"从何而来？
为什么字符串上的 .include 检测不到小写字母？
MongoDB聚合管道帮助(转换MySQL到MongoDB)
c -结束mac上的终端应用程序+清理过程
按字符串部分排序的SQL (Postgresql)
表示如何创建一对多关系(添加数量列)
如何在垫子选项下制作2 span，使其在角材料中左右对齐自动完成
c -如何用介子构建sdl2 ?
为什么在打字稿中给我错误?
ViewModel数据不会单独绑定到UserControl
如何使Qr码大小固定在ZPL无论内容?
为什么使用异步函数"getDownloadURL"来获取 Firebase Storage 中的文件网址
如何使用killtimer来完成Qtimer;
动态内联样式的值由sass变量
如何在matlab中找到一行等于矩阵中的向量?我特别想要有索引
使用命令行构建Xcode 14.3 Rosetta
类型"可分配给类型"T"的约束，但"T"可以使用约束"RGT"的不同子类型进行实例化
如何修改字符串值并将其转换为int, bool等?
TypeScript中的命令和响应泛型

使用tika库从java中的图像中提取文本

相关内容

最新更新

热门标签：