HEROKU 打开数据文件 /app/vendor/tesseract-ocr/tessdata/eng.trained



我有一个部署在Heroku中的Django应用程序。我正在尝试使用 pytesseract 从图像中读取文本。我可以毫无问题地在本地主机中运行此应用程序,但在 heroku 中,即使我添加了此处
提到的pytesseract 构建包,它也会显示错误Error opening data file /app/vendor/tesseract-ocr/tessdata/eng.traineddata

def ocr(serializer):
imgObject = ImageModel.objects.get(id=serializer.data['id'])
imgPath = (os.path.join(settings.MEDIA_ROOT, imgObject.image.name))
InputFile = str(imgPath).replace("\", "/")
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
return pytesseract.image_to_string(Image.open(InputFile))

它看起来像这样一行:

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

希望找到用于执行图像处理的二进制文件。这个二进制文件在 Heroku 上不存在。也许构建包已经处理了配置的这一部分。您是否尝试过注释掉此行以查看它是否有效?

最新更新