我正在Raspbian上试用Jasper。根据Jasper文档,除了PocketSphinx,我们还必须安装CMUCLMTK,MIT语言建模工具包,m2m-aligner,OpenFST和Phonetisaurus。
一旦我完成了PocketSphinx的安装,但在安装所有这些依赖项之前,我使用pocketsphinx_continuous
来测试语音识别。无论准确性如何,它显然能够捕捉到我的演讲并完成翻译过程。我甚至使用CMU的lmtool创建了自己的.lm
和.dict
文件,并在pocketsphinx_continuous
上毫无问题地尝试了它们。
我的问题是:PocketSphinx似乎能够在没有所有这些依赖的情况下执行语音识别。为什么 Jasper 告诉我安装它们?口袋狮身人面像真的需要它们吗?它们服务于什么目的?
在此列表中,至少不需要 2 个。CMUCLMTK 和 MITLM 都是具有相同功能的语言建模工具包。即使您想替换在线 lmtool,也只需要其中之一。同样,Phonetisaurus只需要MITLM和m2m-aligner来训练g2p模型,而不是使用它们。
因此,理想情况下,您只希望MITLM,OpenFST和phonetisaurus替换在线lmtool并在本地添加新单词。 您不需要CMUCLMTK和m2m对准器。
将来,Pocketsphinx将能够在没有Phonetisaurus的情况下使用新单词,因此您将能够放弃这种依赖。
您需要向 Jasper 开发人员投诉,如果他们仍然可以投诉。
CMUCLMTK、MITLM、m2m-aligner、OpenFST 和 Phonetisaurus 不是 PocketSphinx 依赖项,也不是 PocketSphinx 需要的。
Jasper 使用 CMUCLMTK 编译语言模型 (.lm)。
Phonetisaurus依赖于OpenFST Lib。
Jasper使用Phonetisaurus编译字典(.dict)。
Jasper 没有使用 MITLM 和 m2m 对准器。
MITLM,m2m-aligner(仅一次)和OpenFST需要从语料库编译G2P(FST)模型。