与演示页面相比,谷歌视觉文本检测API给出了不同的结果



我想在Google Vision中使用他们的OCR功能,但就像这里的很多人一样,当我使用他们的HTTP API和他们的演示页面时,我的结果并不相同,在他们的演示页面上,他们显示了json请求和结果。

我使用相同的 json 请求,但我有不同的结果,他们的演示页面比他们的 API 更准确。

他们的演示页面: https://cloud.google.com/vision/docs/drag-and-drop

他们的 API 网址 : https://vision.googleapis.com/v1/images:annotate?key=YOURAPIKEY 您可以将他们在演示中生成的 json 传递给测试

唯一的区别是我使用 imageUri 发送我的文件,而谷歌使用他们的本地存储(内容参数(

使用他们的HTTP API,我只能捕获第一行,但不能捕获第二行,但是他们的演示可以捕获它们。

有什么线索吗?

我的测试图像: http://maxence.me/labs/others/c668d1346a74873b8773d7ca19d7feaf_1589063679_0_18.png

我的 JSON :

requests": [
{
"features": [
{
"maxResults": 50,
"type": "LANDMARK_DETECTION"
},
{
"maxResults": 50,
"type": "FACE_DETECTION"
},
{
"maxResults": 50,
"type": "OBJECT_LOCALIZATION"
},
{
"maxResults": 50,
"type": "LOGO_DETECTION"
},
{
"maxResults": 50,
"type": "LABEL_DETECTION"
},
{
"maxResults": 50,
"type": "DOCUMENT_TEXT_DETECTION"
},
{
"maxResults": 50,
"type": "SAFE_SEARCH_DETECTION"
},
{
"maxResults": 50,
"type": "IMAGE_PROPERTIES"
},
{
"maxResults": 50,
"type": "CROP_HINTS"
}
],
"image": {
"source": {
"imageUri": "http://maxence.me/labs/others/c668d1346a74873b8773d7ca19d7feaf_1589063679_0_18.png"
}
},
"imageContext": {
"cropHintsParams": {
"aspectRatios": [
0.8,
1,
1.2
]
}
}
}
]
}

我的结果 : https://pastebin.com/fsWPKg1r

谷歌视觉演示JSON:

{
"requests": [
{
"features": [
{
"maxResults": 50,
"type": "LANDMARK_DETECTION"
},
{
"maxResults": 50,
"type": "FACE_DETECTION"
},
{
"maxResults": 50,
"type": "OBJECT_LOCALIZATION"
},
{
"maxResults": 50,
"type": "LOGO_DETECTION"
},
{
"maxResults": 50,
"type": "LABEL_DETECTION"
},
{
"maxResults": 50,
"type": "DOCUMENT_TEXT_DETECTION"
},
{
"maxResults": 50,
"type": "SAFE_SEARCH_DETECTION"
},
{
"maxResults": 50,
"type": "IMAGE_PROPERTIES"
},
{
"maxResults": 50,
"type": "CROP_HINTS"
}
],
"image": {
"content": "(data from c668d1346a74873b8773d7ca19d7feaf_1589063679_0_18.png)"
},
"imageContext": {
"cropHintsParams": {
"aspectRatios": [
0.8,
1,
1.2
]
}
}
}
]
}

谷歌视觉演示页面结果 : https://pastebin.com/6ihvKwZr

在 15.5.2020 上进行了升级

发行说明

今天,他们的HTTP API给出了与演示页面相同的结果...也许他们的版本有延迟或谷歌在那里?:o

最新更新