如何在Opensmile中使用emobase.config文件?

我想使用预定义的emobase.config文件使用opensmile提取音频特征。但是，当我输入.wav并且只得到一个帧大小的输出时。

我将帧模式更改为固定，并给出了固定步长和固定大小的值，但它抛出了错误。我不知道像 emobase.conf 这样的内置配置文件是否会为整个视频生成输出，而不是逐帧生成输出。

有没有办法为内置配置文件提取每个帧大小的特征？我得到了自己生成的配置文件的帧输出！但是对于内置的，我不知道该怎么做！

这是由配置文件中的设置引起的。在文件末尾的"数据输出配置"中，你会发现"reader.dmLevel=fun"。这意味着只会打印出功能(对整个声音文件而不是每帧采取的措施(。如果将其更改为"lld"(低级描述符(，它将逐帧打印出来。我认为这适用于所有表情库配置文件和emo_large文件。

Tl;dr -> 在配置文件的数据输出配置中将 reader.dmLevel=fun 更改为 reader.dmLevel=lld。

相关内容