我已经使用tesseract从扫描文档中提取文本,我可以从扫描的文档中获取文本。现在,我想从手写表单(硬拷贝(中提取文本,并使用该文本自动填写我的在线表单(同一手写表单的软拷贝(。有人知道该怎么做吗?
事先感谢您的帮助。
tesseract OCR非常强大,但确实有以下限制:
- 与某些OCR发动机不同(例如美国邮政部门用于排序邮件的引擎(, Tesseract无法识别手写,并且限于总计中的大约64个字体。 。
- Tesseract需要一些预处理以改善OCR结果;图像需要适当缩放,具有尽可能多的图像对比度,并具有水平对准文本。
- 最后,Tesseract OCR仅在Linux,Windows和Mac OSX。 上使用
原始文章:https://www.raywenderlich.com/93276/implementing-tesseract-ocr-ios