在Android,法语上使用音素识别的Pocketsphinx的识别准确性差



我正在做一个项目,我必须将Pocketsphinx的语音功能集成到Android应用程序中。事实上,我必须集成 Pocketpshinx 提供的音素识别功能,该功能应该能够重新识别法语中的音素,例如语音识别器应该能够识别音节(如"de"、"re"、"se"等)、辅音(如"m"、"f"、"g"等)、双辅音(如"kl"、"ks"、"gr"等)和元音(如"a"、"o"、"e",等)。现在,我已经集成了Pocketsphinx来识别上面提到的音素,但我的结果真的很糟糕。例如,当我发音"o"时,识别的结果有时是:"SIL ff ei au"(即使我根本没有发音字母"f"和"e"),或者在开头出现其他不发音的东西。出现在开头的字母并不总是相同的(有时我会得到"ll"、"uu"等)。但有时,我发音的字母出现在开头(例如,对于"a",我得到"SIL aa SIL"),但这种情况很少发生。那么,你们能否提供帮助,让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母数量是固定的)?或者,也许我需要对声学模型进行适应,或者训练声学模型?

提前非常感谢!

在您的模型中找到 feat.params 并根据您的选择更改 -cmuinit 值,此外,"-kws_threshold"的值为 1e-40f 以消除误报。

最新更新