我正在尝试使用pytesseract将PNG图像文件转换为文本。它给了我以下错误。TesseractError:
(1, 'Tesseract Open Source OCR Engine v3.05.00dev with Leptonica Warning in pixReadMemPng: 解决方法: 写入临时文件 libpng 警告:使用 libpng-1.4.3 构建但运行 1.5.14 的应用程序 pixReadStreamPng 中的错误:png_ptr未制作 pixReadMemPng 中的错误:pix 未读取 pixReadMem 中的错误:png:处理过程中未返回 pix 错误。
当我做 tesseract -v
tesseract 3.05.00dev
leptonica-1.72 libjpeg 9 : libpng 1.5.14 : libtiff 4.0.3 : zlib 1.2.5 : libopenjp2
2.1.0
我也遇到了这个问题,在网上找不到答案。
但是我尝试下载tesseract-ocr并安装它,然后:
- 设置环境变量,
TESSDATA_PREFIX:"C:Program Files (x86)Tesseract-OCRtessdata"
- 将
C:Program Files (x86)Tesseract-OCR
添加到 PATH 变量。 - 编辑第 35 行中的
pytesseract.py
,tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
当我在 anaconda 提示符下调用pytesseract.image_to_string(img)
时,它会返回一个字符串。我的环境:
- 皮特塞雷克特 0.2.6
- 枕头 5.2.0
- Tesseract 4.00.00alpha
我遇到了同样的问题:
在我的电脑中,引擎版本是3.0。
当我安装了 5.0 或更高版本的 tesseract 引擎并将其路径用作
pytesseract.pytesseract.tesseract_cmd=r"C:Program Files (x86)Tesseract-OCRtesseract.exe"
泰瑟拉特下载链接