我正在尝试使用sphinx4将我的wav文件转换为文本文件。是否有可能识别出语法文件中没有包含的单词?
这是一种常见的误解,认为您应该完全不使用任何语法来有效地识别语音并解决应用程序任务。相反,使用一些解决方案来解决这个问题是实际的,它可以工作并解码你的文件。
如果你不确定领域或语言,你总是可以使用一个非常通用的语言模型,辅以基于音节的语法来解码未知的单词。在此之后,通常使用网络查询将基于音节的变体转换为单词,从而允许系统获取词汇。这将使你对非常一般的语音类型得到很好的结果。
Sphinx-4支持