如何识别语音笔记的说话者



我想构建一个项目,让我识别说话人。我希望我的用户说一些句子,记录并发送给我。然后,我将识别所说的单词并将用户与语音联系起来,例如00001.因此,如果他们决定使用我的一些"受保护"服务,他们将不得不再次说出这些话。如果新语音与00001匹配,并且单词与以前的单词匹配,则将授予他们访问服务的权限。

我已经研究了谷歌语音API,但我看到我只能说出单词而不是声音。我正在看这篇文章 - https://www.tutorialspoint.com/speech-recognition-in-python-using-google-speech-api

请问,是否有其他 API 可以提供我想要实现的目标?

你可以尝试使用 https://dialogflow.com/我没有测试它,但在我的公司被用来根据用户所说的话触发操作。

最新更新