我想在Google Vision中使用他们的OCR功能,但就像这里的很多人一样,当我使用他们的HTTP API和他们的演示页面时,我的结果并不相同,在他们的演示页面上,他们显示了json请求和结果。
我使用相同的 json 请求,但我有不同的结果,他们的演示页面比他们的 API 更准确。
他们的演示页面: https://cloud.google.com/vision/docs/drag-and-drop
他们的 API 网址 : https://vision.googleapis.com/v1/images:annotate?key=YOURAPIKEY 您可以将他们在演示中生成的 json 传递给测试
唯一的区别是我使用 imageUri 发送我的文件,而谷歌使用他们的本地存储(内容参数(
使用他们的HTTP API,我只能捕获第一行,但不能捕获第二行,但是他们的演示可以捕获它们。
有什么线索吗?
我的测试图像: http://maxence.me/labs/others/c668d1346a74873b8773d7ca19d7feaf_1589063679_0_18.png
我的 JSON :
requests": [
{
"features": [
{
"maxResults": 50,
"type": "LANDMARK_DETECTION"
},
{
"maxResults": 50,
"type": "FACE_DETECTION"
},
{
"maxResults": 50,
"type": "OBJECT_LOCALIZATION"
},
{
"maxResults": 50,
"type": "LOGO_DETECTION"
},
{
"maxResults": 50,
"type": "LABEL_DETECTION"
},
{
"maxResults": 50,
"type": "DOCUMENT_TEXT_DETECTION"
},
{
"maxResults": 50,
"type": "SAFE_SEARCH_DETECTION"
},
{
"maxResults": 50,
"type": "IMAGE_PROPERTIES"
},
{
"maxResults": 50,
"type": "CROP_HINTS"
}
],
"image": {
"source": {
"imageUri": "http://maxence.me/labs/others/c668d1346a74873b8773d7ca19d7feaf_1589063679_0_18.png"
}
},
"imageContext": {
"cropHintsParams": {
"aspectRatios": [
0.8,
1,
1.2
]
}
}
}
]
}
我的结果 : https://pastebin.com/fsWPKg1r
谷歌视觉演示JSON:
{
"requests": [
{
"features": [
{
"maxResults": 50,
"type": "LANDMARK_DETECTION"
},
{
"maxResults": 50,
"type": "FACE_DETECTION"
},
{
"maxResults": 50,
"type": "OBJECT_LOCALIZATION"
},
{
"maxResults": 50,
"type": "LOGO_DETECTION"
},
{
"maxResults": 50,
"type": "LABEL_DETECTION"
},
{
"maxResults": 50,
"type": "DOCUMENT_TEXT_DETECTION"
},
{
"maxResults": 50,
"type": "SAFE_SEARCH_DETECTION"
},
{
"maxResults": 50,
"type": "IMAGE_PROPERTIES"
},
{
"maxResults": 50,
"type": "CROP_HINTS"
}
],
"image": {
"content": "(data from c668d1346a74873b8773d7ca19d7feaf_1589063679_0_18.png)"
},
"imageContext": {
"cropHintsParams": {
"aspectRatios": [
0.8,
1,
1.2
]
}
}
}
]
}
谷歌视觉演示页面结果 : https://pastebin.com/6ihvKwZr
在 15.5.2020 上进行了升级
发行说明
今天,他们的HTTP API给出了与演示页面相同的结果...也许他们的版本有延迟或谷歌在那里?:o