小贝子编程

azure计算机视觉api 3.2版本的问题，因为它读取了一些带有额外垃圾值的pdf文件，而旧版本中没有这些垃圾值

本文关键字：版本文件 pdf api 计算机视觉读取因为 azure 问题 python azure computer-vision ocr vision-api
更新时间 : 2023-09-21
英文 : issue with azure computer vision api 3.2 version, as it reading some pdf files with additional garbage values which was not there in older version

我正在为我的pdf文件测试azure计算机视觉api最新3.2版本。对一些人来说，它工作得很好，但对一些包含itext的pdf文件来说(如pdf的meta信息中所示(，它工作不好，并返回页面上不存在的附加垃圾值，而且表的表头在表行结束后不断重复。令人惊讶的是，相同的pdf文件和以前版本的OCR都能很好地工作。

我对此没有太多想法，我的be azure在请求时更改了一些技术或添加了一些额外的参数，我不会随它发送。

因此，如果有人知道，请为这个问题提出解决方案，谢谢。

从V2到V3有一些机会，如本文档所示：https://learn.microsoft.com/en-us/azure/cognitive-services/computer-vision/upgrade-api-versions

除此之外，我没有看到任何额外的价值将被添加到新的V3.2 API。

如果不是保密的，请将您使用的型号版本和样品分享给我们，以便我们复制。

azure计算机视觉api 3.2版本的问题，因为它读取了一些带有额外垃圾值的pdf文件，而旧版本中没有这些垃圾值

相关内容

最新更新

热门标签：