如何在python中只使用云视觉api检测特定语言而忽略其他语言



我想从图像中检测韩语,并且只检测韩语。我不想察觉英语,即使它出现在图像中。我似乎在互联网上找不到任何能为我做到这一点的方法。

我尝试过的:

我知道image_context属性,并且已经用它只提到朝鲜语了,但并没有忽略英语文本。我做到了:

response = client.document_text_detection(image=image, image_context={"language_hints": ["ko"]})

我想要什么

有没有办法不从图像中检测出英语?

或者有没有一种方法可以阻止某些符号被检测到?

我相信image_context属性并不是用来限制要在单个图像上提取的语言。它的作用恰恰相反,因为它有助于扩大并获得更好的理解语言的结果。1

不需要向服务提供语言提示,但如果服务在检测图像中使用的语言时遇到问题,则可以这样做。

如果语言提示为空,我们将尝试自动检测最合适的语言。TEXT_DETECTION端点将自动检测仅支持的语言的子集,而DOCUMENT_TEXT_DETECTION端点将自动检测支持的语言。

实现用例的一种方法可能是操纵Vision API的返回响应。您可以只提取朝鲜语字符,也可以使用英文文本排除结果。

"textAnnotations": [
{
"locale": "ko",
"description": "牛牛面馆n",
"boundingPoly": {
"vertices": [
{
"x": 159,
"y": 212
},
{
"x": 947,
"y": 212
},
{
"x": 947,
"y": 354
},
{
"x": 159,
"y": 354
}
]
}
},

或者您可以为此提交功能请求。

最新更新