Azure ComputerVision OCR and PDF format



我发现了几个关于是否以及如何使用认知服务执行 OCR 的旧问题。在认知服务上,我可以找到分步说明,告诉我如何完成 PDF 中的 OCR。 当我像页面底部的示例一样做时,我仍然得到 unsuppertdMediaType 结果

{ "code": "不支持的媒体类型", "requestId": "c427e1c7-3f99-4a74-a36f-1620e68e3b64", "message": "支持的媒体类型:应用程序/八位字节流、多部分/表单数据或应用程序/json" }

当我将PDF更改为图像时,一切都很好。 我目前关注认知服务 但是,虽然请求似乎很好,但文档类型仍然不受支持。 我打电话:

https://.cognitiveservices.azure.com/vision/v2.0/ocr?language=de&detectOrientation=true&Ocp-Apim-Subscription-Key=&Content-Type=application/octet-stream

当然,文件包含在正文中。

我不发布 C# 或 PowerShell,因为问题似乎确实出在我从上面提到的 URL 发出的请求上。

有人可以帮我了解如何使用 Azure 计算机视觉获取从 PDF 获取文本的有效请求吗?

您收到此错误是因为根据文档,OCR 不支持 PDF

OCR API 适用于满足以下要求的图像:

  • 图像必须以 JPEG、PNG、GIF 或 BMP 格式呈现。
  • 输入图像的大小必须介于 50 x 50 和 4200 x 4200 像素之间。
  • 图像中的文本可以旋转 90 度的任意倍数加上最大 40 度的小角度。

话虽如此,您可以使用新的读取 API,因为它根据文档支持 PDF

读取 API 适用于满足以下要求的图像:

  • 图像必须以 JPEG、PNG、BMP、PDF 或 TIFF 格式呈现。
  • 图像的尺寸必须介于 50 x 50 和 10000 x 10000 像素之间。PDF 页面必须为 17 x 17 英寸或更小。
  • 图像的文件大小必须小于 20 兆字节 (MB(。

如果您遵循要求并使用正确的端点,则可以保证工作!

相关内容

  • 没有找到相关文章

最新更新