如何利用MFCC特征训练SVM分类器进行语音识别



我目前正在与语音识别项目讨论阶段,我使用MFCC特征提取,但从函数返回的MFCC特征是矩阵,例如。每个语音文件(wav)的(20,38)特征矩阵。但是我如何将这个特征传递给SVM分类器呢?对于SVM(和其他分类器),每个样本都由一个向量表示,对吗?但是每个样本的MFCC特征是一个矩阵。1)一个20*38的矢量,e,g。哪条路是对的?有什么有用的代码,论文吗?

谢谢!照

对于像语音识别这样的序列标记任务,您需要使用支持向量机和HMM的组合,而不仅仅是支持向量机

  1. 将特征矩阵与GMM-HMM状态对齐,得到每个HMM状态对应的特征
  2. 在属于每个状态的特征上训练SVM
  3. 用SVM-HMM代替GMM-HMM

要了解更多,请阅读

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442

为了更快,使用现有的工具包,如:

http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html

相关内容

  • 没有找到相关文章

最新更新