狮身人面像返回除口袋狮身人面像以外的其他结果

我终于成功了。训练后，我的WER(单词错误率(为 0%。我只有一个用于简单语音识别的小数据集(仅适用于另一种语言中的"是"和"否"(。我用狮身人面像训练(126个训练文件，12个测试文件(。音频文件的长度为 ~5 秒，包含 8 个单词(混合是/否(。

经过培训后，我决定带着我的测试文件通过口袋狮身人面像运行它们。我测试的几乎每个文件都至少有 1 个单词错误。有时它比预期多识别 1-2 个单词。有时，它将"是"识别为"否"。

我想知道为什么我从狮身人面像

我想知道为什么我从狮身人面像和口袋狮身人面像得到不同的结果。

您没有足够的训练数据。

我还想知道如何使用pocketsphinx改善我的结果。(尤其是口袋狮身人面像将一个"不"识别为两个"不"的东西。

使用更多训练数据。

相关内容