Tesseract 开源 OCR 引擎 v3.05.00dev 与 pixReadMemPng 中的 Leptonica



我正在尝试使用pytesseract将PNG图像文件转换为文本。它给了我以下错误。TesseractError:
(1, 'Tesseract Open Source OCR Engine v3.05.00dev with Leptonica Warning in pixReadMemPng: 解决方法: 写入临时文件 libpng 警告:使用 libpng-1.4.3 构建但运行 1.5.14 的应用程序 pixReadStreamPng 中的错误:png_ptr未制作 pixReadMemPng 中的错误:pix 未读取 pixReadMem 中的错误:png:处理过程中未返回 pix 错误。

当我做 tesseract -v
tesseract 3.05.00dev
leptonica-1.72 libjpeg 9 : libpng 1.5.14 : libtiff 4.0.3 : zlib 1.2.5 : libopenjp2
2.1.0

我也遇到了这个问题,在网上找不到答案。

但是我尝试下载tesseract-ocr并安装它,然后:

  1. 设置环境变量,TESSDATA_PREFIX:"C:Program Files (x86)Tesseract-OCRtessdata"
  2. C:Program Files (x86)Tesseract-OCR添加到 PATH 变量。
  3. 编辑第 35 行中的pytesseract.pytesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

当我在 anaconda 提示符下调用pytesseract.image_to_string(img)时,它会返回一个字符串。我的环境:

  • 皮特塞雷克特 0.2.6
  • 枕头 5.2.0
  • Tesseract 4.00.00alpha

我遇到了同样的问题:

在我的电脑中,引擎版本是3.0。

当我安装了 5.0 或更高版本的 tesseract 引擎并将其路径用作

pytesseract.pytesseract.tesseract_cmd=r"C:Program Files (x86)Tesseract-OCRtesseract.exe"

泰瑟拉特下载链接

最新更新