我读了很多关于这方面的文章,但我就是不明白我该如何进行。
我正在尝试使用 HMM 的 MFCC 功能构建一个基本的语音识别系统,我正在使用此处可用的数据。我正在使用Matlab来做到这一点。
到目前为止,我已经使用此库从语音文件中提取了 MFCC 向量。我不明白的是如何将这些功能用于HMM。
你能解释一下我如何训练HMM吗?我正在使用在 matlab 中找到的 hmm 实现。请不要让我参考其他库,因为我实际上是在试图了解 hmm 的工作原理。
-
如何初始化跃迁和发射矩阵?
-
我假设每个状态在单词中发出一个特定的音素,那么为了训练 HMM,我们应该如何传递 MFCC 向量?
-
我应该采取哪些步骤来训练HMM?
这里给出了HMM的matlab实现函数
编辑:已经很长时间了,但我想这个问题仍然与它点击的观看次数有关,我确实解决了这个问题,代码可以在我的 GitHub 上找到
你不能用这个hmm来训练来自MFCC向量的语音HMM。此框架仅支持编号规则,不支持特征向量。它是一个简单的离散HMM工具箱。
您必须使用像这样的面向语音的库:
http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html