我正在尝试构建语音识别应用程序。到目前为止,我已经从10个示例语音中提取了MFCC功能。每个样品产生不同的形状,如下所示:
(698,12)
(414,12)
(610,12)
(586,12)
(698,12)
(282,12)
(250,12)
(370,12)
(694,12)
(490,12)
我计划使用KNN(或其他分类算法)来执行此操作,但是每个样品的形状并不相同,并且2D数组不是1D阵列,因此我可以将其直接馈送到模型中。
如何将此数组转换为这样的方式,以便我可以将其馈入机器学习算法或如何使用2D数组构建模型?
请建议
我使用gmm完成了此操作。因此,每个观察结果都会有自己的模型。