我想为听写类应用程序构建语音识别系统。我读了这本书和其他教程,但所有的教程都是针对命令和控制类应用程序的。对于这些应用程序,命令集,单词限制,并且使用任务语法(gram
文件)手动指定。
在我的应用程序中,不可能指定这样的语法,因为我将处理包含两个人之间对话的巨大音频文件。
所以我想知道是否有可能使用htk构建这样的应用程序。
谢谢…
多夜睡眠不足后更新
我使用Sphinx的准确率为86%。语言模型有一些问题(我不知道到底出了什么问题,我正在努力找到它),所以我使用Sphinx lmtool
创建了新的语言模型,这是一个基于web的语言模型生成服务。你可以通过这个链接
另外,我已将声学模型从HUB更改为WSJ。
可以。有两种解码器用于此目的:
ATK和
朱利叶斯
都要求您为大词汇量语音识别提供语言模型
我还建议你看看CMUSphinx,它更容易使用