我终于成功了。训练后,我的WER(单词错误率(为 0%。我只有一个用于简单语音识别的小数据集(仅适用于另一种语言中的"是"和"否"(。我用狮身人面像训练(126个训练文件,12个测试文件(。音频文件的长度为 ~5 秒,包含 8 个单词(混合是/否(。
经过培训后,我决定带着我的测试文件通过口袋狮身人面像运行它们。我测试的几乎每个文件都至少有 1 个单词错误。有时它比预期多识别 1-2 个单词。有时,它将"是"识别为"否"。
我想知道为什么我从狮身人面像- 和口袋狮身人面像得到不同的结果。
- 我还想知道如何使用pocketsphinx改善我的结果。(尤其是口袋狮身人面像将一个"不"识别为两个"不"的东西。
我想知道为什么我从狮身人面像和口袋狮身人面像得到不同的结果。
您没有足够的训练数据。
我还想知道如何使用pocketsphinx改善我的结果。(尤其是口袋狮身人面像将一个"不"识别为两个"不"的东西。
使用更多训练数据。