如何从vocab创建Dictionary文件



如何为我们的特定域语言模型创建字典(.dict)文件。我使用CMU工具包来创建ARPA格式的语言模型,但在其中没有创建.dict文件的选项。提前谢谢。

有一个简短的教程页面,介绍了为Sphinx生成字典的几种方法。

总的来说,现有的英语词典涵盖了相当多的单词。如果它不包含任何特定的领域单词,发音应该由第一个链接中列出的字形到音素(G2P)系统生成。G2P从现有字典中学习,并为新字典生成发音。

需要考虑的一件事是声学模型。如果你使用一些已经训练过的狮身人面像模型,你应该确保发音是用与训练字典相同的音素集生成的。

最新更新