已经训练了用于单词识别的HMM模型



我已经使用自动编码器实现了一个音素分类器(给定一个音频文件数组,它返回所有识别的音素)。我想扩展这个项目,使单词识别成为可能。是否存在一个已经训练好的HMM模型(英语),可以识别给定音素列表的单词?

谢谢大家。

我不知道有任何解码器可以帮助您。语音识别软件不能以这种方式工作。

通常这样的事情需要自定义实现动态波束搜索。这不是一项艰巨的任务,可能需要100行代码。它还取决于你的语音解码器产生什么。它是语音格(理想情况下),还是有分数的1-测试结果,或者只是没有分数的1-结果。

如果你有一个合适的晶格,你可能想尝试openfst工具包,将LM和dictionary转换为FST,然后用晶格FST组合,然后使用fstbestpath找到最佳路径。尽管如此,您可以简单地编写一个动态搜索,而不是所有这些语音转换。

百度在他们的项目中还将语音转换为字母,然后使用语言模型来固定字母序列。但他们说,如果没有langauge模型,它也同样有效。

最新更新