非引导语音到文本的转换



我正试图想出一种将语音转换为文本的方法。我正试图用斯芬克斯来达到这个目的。我所说的无引导性言语对文本的意思是,说话者并不一定要从一组确定的句子中说话。相反,他可能会说任何一句话。所以我不可能有一个语法文件,其中每个单词都是预先写在语法文件中的替代词之一。我明白我必须以某种方式训练斯芬克斯才能做到这一点。

但我是狮身人面像的初学者。如何开始训练狮身人面像转换无引导语言?斯芬克斯有可能实现无导向转换吗?

你正在做的任务,到目前为止,还不可能完成,至少不能以令人满意的精度完成。

对于基于sphinx的解决方案:您必须创建包含所有要识别的单词的字典。没有别的办法。

一旦你有了字典,你就可以在它的基础上生成一个简单的n-gram模型,只有一元图——每个一元图将是一个单词。每个单词的概率可能是相同的,或者您可以尝试对将要使用的单词进行一些统计分析。

相关内容

  • 没有找到相关文章

最新更新