我目前正在与语音识别项目讨论阶段,我使用MFCC特征提取,但从函数返回的MFCC特征是矩阵,例如。每个语音文件(wav)的(20,38)特征矩阵。但是我如何将这个特征传递给SVM分类器呢?对于SVM(和其他分类器),每个样本都由一个向量表示,对吗?但是每个样本的MFCC特征是一个矩阵。1)一个20*38的矢量,e,g。哪条路是对的?有什么有用的代码,论文吗?
谢谢!照
对于像语音识别这样的序列标记任务,您需要使用支持向量机和HMM的组合,而不仅仅是支持向量机
- 将特征矩阵与GMM-HMM状态对齐,得到每个HMM状态对应的特征
- 在属于每个状态的特征上训练SVM
- 用SVM-HMM代替GMM-HMM
要了解更多,请阅读
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442为了更快,使用现有的工具包,如:
http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html