为什么 Jasper 需要这么多依赖项



我正在Raspbian上试用Jasper。根据Jasper文档,除了PocketSphinx,我们还必须安装CMUCLMTK,MIT语言建模工具包,m2m-aligner,OpenFST和Phonetisaurus。

一旦我完成了PocketSphinx的安装,但在安装所有这些依赖项之前,我使用pocketsphinx_continuous来测试语音识别。无论准确性如何,它显然能够捕捉到我的演讲并完成翻译过程。我甚至使用CMU的lmtool创建了自己的.lm.dict文件,并在pocketsphinx_continuous上毫无问题地尝试了它们。

我的问题是:PocketSphinx似乎能够在没有所有这些依赖的情况下执行语音识别。为什么 Jasper 告诉我安装它们?口袋狮身人面像真的需要它们吗?它们服务于什么目的?

在此列表中,至少不需要 2 个。CMUCLMTK 和 MITLM 都是具有相同功能的语言建模工具包。即使您想替换在线 lmtool,也只需要其中之一。同样,Phonetisaurus只需要MITLM和m2m-aligner来训练g2p模型,而不是使用它们。

因此,理想情况下,您只希望MITLM,OpenFST和phonetisaurus替换在线lmtool并在本地添加新单词。 您不需要CMUCLMTK和m2m对准器。

将来,Pocketsphinx将能够在没有Phonetisaurus的情况下使用新单词,因此您将能够放弃这种依赖。

您需要向 Jasper 开发人员投诉,如果他们仍然可以投诉。

CMUCLMTK、MITLM、m2m-aligner、OpenFST 和 Phonetisaurus 不是 PocketSphinx 依赖项,也不是 PocketSphinx 需要的。

Jasper 使用 CMUCLMTK 编译语言模型 (.lm)。

Phonetisaurus依赖于OpenFST Lib。

Jasper使用Phonetisaurus编译字典(.dict)。

Jasper 没有使用 MITLM 和 m2m 对准器。

MITLM,m2m-aligner(仅一次)和OpenFST需要从语料库编译G2P(FST)模型。

相关内容

  • 没有找到相关文章

最新更新