节点tesseract ocr抛出无法打开输入文件:stdin错误



代码:

const tesseract = require("node-tesseract-ocr");
const config = {
lang: "eng",
oem: 1,
psm: 3,
};
tesseract
.recognize("https://tesseract.projectnaptha.com/img/eng_bw.png", config)
.then((text) => {
console.log("Result:", text);
})
.catch((error) => {
console.log(error.message);
});

错误:

Command failed: tesseract stdin stdout -l eng --oem 1 --psm 3
read_params_file: Can't open 1
read_params_file: Can't open -psm
read_params_file: Can't open 3
Tesseract Open Source OCR Engine v3.02 with Leptonica
Cannot open input file: stdin

附加信息:

  • 平台:Windows 11
  • 节点版本:v18.12.1
  • Tesseract版本:3.02

我试图使用NodeJS从图像中提取文本,但收到这个错误我做错了什么?

是否有其他可靠的库可用于从图像中提取文本?

  1. tesseract在captcha上不起作用
  2. 您使用的是过时的tesseract,但命令适用于当前版本的tesserct

检查安装是否正确,键入terminal"tesseract";,如果出现错误:检查环境变量是否正确:

  1. 名称:TESSDATA_PREFIX值:C:\Program Files\Tesseract OCR\TESSDATA
  2. 名称:tesseract值:C:\Program Files\tesseract OCR\tesseract.exe
  3. 在PATH变量中添加C:\Program Files\Tesseract OCR

如果您正在使用VSCode运行脚本,请重新启动窗口(对我有效)。

最新更新