如何使用Google语音API识别混合语言的代码开关

通常人们使用其母语英语进行对话。我需要Google API来识别语音样本中的两种语言。

例如：" aaj ka天气kaisa hai"这句话包含印地语(hi-in(和英语(en-in(语言

如何设置API参数以识别混合或多语言语音的代码转换？

您不能混合语言。

语音识别大致包含3个部分 ->声音模型，语言模型和字典。

声音模型是数据训练的结果，其中包含音频信号与语音之间的关系

字典包含单词及其发音，例如，在一般语音识别词典上，单词top在" t ah p"中发音。

语言模型是单词与创建句子的连接，例如" i"一词与" am"有关，因此语音识别器很少(或永远不会(给出"我是"或"我"的结果。

每种语言都有自己的声音模型(语音(，字典(单词(和语言模型(句子(，因此我们可以将它们混合在一起。

问题是：是否可能？

答案是：是！

您可以使用许多工具来构建自己的语言(在这种情况下为印地语英语(，我已经尝试过一种称为 cmu sphinx/Pocket Sphinx。用它制作字典。这将是很多工作要做，但是您可以配置语音识别所需的任何内容。

任何平台实现的链接：https：//github.com/cmusphinx

Google语音API不起作用，并且不是为混合语言而设计的。印度很少有公司开发专门的API，用于印地语英语案例，他们认识到这种混合语言很好。

相关内容