azure计算机视觉api 3.2版本的问题,因为它读取了一些带有额外垃圾值的pdf文件,而旧版本中没有这些垃圾值



我正在为我的pdf文件测试azure计算机视觉api最新3.2版本。对一些人来说,它工作得很好,但对一些包含itext的pdf文件来说(如pdf的meta信息中所示(,它工作不好,并返回页面上不存在的附加垃圾值,而且表的表头在表行结束后不断重复。令人惊讶的是,相同的pdf文件和以前版本的OCR都能很好地工作。

我对此没有太多想法,我的be azure在请求时更改了一些技术或添加了一些额外的参数,我不会随它发送。

因此,如果有人知道,请为这个问题提出解决方案,谢谢。

从V2到V3有一些机会,如本文档所示:https://learn.microsoft.com/en-us/azure/cognitive-services/computer-vision/upgrade-api-versions

除此之外,我没有看到任何额外的价值将被添加到新的V3.2 API。

如果不是保密的,请将您使用的型号版本和样品分享给我们,以便我们复制。

最新更新