Tesseract 开源 OCR 引擎 v3.05.00dev 与 pixReadMemPng 中的 Leptonica

我正在尝试使用pytesseract将PNG图像文件转换为文本。它给了我以下错误。TesseractError：
(1， 'Tesseract Open Source OCR Engine v3.05.00dev with Leptonica Warning in pixReadMemPng：解决方法：写入临时文件 libpng 警告：使用 libpng-1.4.3 构建但运行 1.5.14 的应用程序 pixReadStreamPng 中的错误：png_ptr未制作 pixReadMemPng 中的错误：pix 未读取 pixReadMem 中的错误：png：处理过程中未返回 pix 错误。

当我做 tesseract -v
tesseract 3.05.00dev
leptonica-1.72 libjpeg 9 ： libpng 1.5.14 ： libtiff 4.0.3 ： zlib 1.2.5 ： libopenjp2
2.1.0

我也遇到了这个问题，在网上找不到答案。

但是我尝试下载tesseract-ocr并安装它，然后：

设置环境变量，TESSDATA_PREFIX:"C:Program Files (x86)Tesseract-OCRtessdata"
将C:Program Files (x86)Tesseract-OCR添加到 PATH 变量。
编辑第 35 行中的pytesseract.py，tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

当我在 anaconda 提示符下调用pytesseract.image_to_string(img)时，它会返回一个字符串。我的环境：

皮特塞雷克特 0.2.6
枕头 5.2.0
Tesseract 4.00.00alpha

我遇到了同样的问题：

在我的电脑中，引擎版本是3.0。

当我安装了 5.0 或更高版本的 tesseract 引擎并将其路径用作

pytesseract.pytesseract.tesseract_cmd=r"C:Program Files (x86)Tesseract-OCRtesseract.exe"

泰瑟拉特下载链接

相关内容

最新更新

热门标签：