我正在制作一个语音情感识别程序。
使用mfcc+K-mean+GMM,我得到了-15012、-43400、-8000 这样的可能性
它的价值比我高。它的价值正确吗?
波形文件的长度通常为2~3,我使用下面的选项初始化。
MFCC option
SampleRate = 16000
WindowSize = 256
NumberCoefficients = 13
UseFirstCoefficient = true
MinFreq = 20.0
MaxFreq = 16000.0
NumberFilters = 25
K-Means Clustering default option
NumberCluster = 2
可能性的实际值取决于特征提取过程中使用的许多参数。例如,过滤器组可能以不同的方式创建。不同发动机的情况不同。因此,仅仅看价值观,你无法判断它们是否正确。
既然你没有提到发动机,就不可能回答这个问题。