如何使用Google语音API识别混合语言的代码开关



通常人们使用其母语 英语进行对话。我需要Google API来识别语音样本中的两种语言。

例如:" aaj ka天气kaisa hai"这句话包含印地语(hi-in(和英语(en-in(语言

如何设置API参数以识别混合或多语言语音的代码转换?

您不能混合语言。

语音识别大致包含3个部分 ->声音模型,语言模型和字典。

声音模型是数据训练的结果,其中包含音频信号与语音之间的关系

字典包含单词及其发音,例如,在一般语音识别词典上,单词top在" t ah p"中发音。

语言模型是单词与创建句子的连接,例如" i"一词与" am"有关,因此语音识别器很少(或永远不会(给出"我是"或"我"的结果。

每种语言都有自己的声音模型(语音(,字典(单词(和语言模型(句子(,因此我们可以将它们混合在一起。

问题是:是否可能?

答案是:是!

您可以使用许多工具来构建自己的语言(在这种情况下为印地语 英语(,我已经尝试过一种称为 cmu sphinx/Pocket Sphinx。用它制作字典。这将是很多工作要做,但是您可以配置语音识别所需的任何内容。

任何平台实现的链接:https://github.com/cmusphinx

Google语音API不起作用,并且不是为混合语言而设计的。印度很少有公司开发专门的API,用于印地语 英语案例,他们认识到这种混合语言很好。

最新更新