谷歌语音 API 和覆盖电话号码识别



>有谁知道在使用Google Speech API时是否有办法操纵电话号码的识别? 我正在尝试实现一个转录场景,其中呼叫者会说一串字母和数字,但开箱即用的逻辑似乎是尝试将任何数字序列适合电话号码方案,即使这意味着将字母呈现为数字,它们听起来可能模糊地相似(或不相似(。 我尝试使用语音上下文来操纵"电话号码"中的值,方法是键入并给出整个内容作为语音上下文(例如"八七七二蜜蜂三七"(,但它拒绝覆盖被解释为电话号码的数字。 有没有人遇到过这个问题或知道可以解决此问题的任何方法?

谢谢!

我不知道有一个简单的方法可以做到这一点。 对于适用于 JavaScript 的 Web 语音 API,执行以下操作似乎会产生较少的强制采用电话号码格式的结果。

设置maxAlternatives = 2,例如

var recognition = new speechRecognition();
recognition.maxAlternatives = 2;

然后使用提供的第二个结果,例如,

constr speechToText = event.results[0][1].transcript

通过处理结果,您可以走得很远。剩下的挑战是,由于结果经常将数字聚集在一起,因此您无法区分一系列个位数和一个多位数数字(例如,"15"和"1","5"(。 此方法的实用性取决于应用尝试捕获的数字的具体情况。

在至少一种情况下,将语言设置为 en-PH(英语菲律宾(似乎已经解决了这个问题,或者至少显着改善了这个问题。其他英语语言选项也可能有效。

en-GB 以英国格式的数字返回,他们先输入一个数字,然后输入其余数字。

最新更新