我想使用预定义的emobase.config文件使用opensmile提取音频特征。但是,当我输入.wav并且只得到一个帧大小的输出时。
我将帧模式更改为固定,并给出了固定步长和固定大小的值,但它抛出了错误。我不知道像 emobase.conf 这样的内置配置文件是否会为整个视频生成输出,而不是逐帧生成输出。
有没有办法为内置配置文件提取每个帧大小的特征?我得到了自己生成的配置文件的帧输出!但是对于内置的,我不知道该怎么做!
这是由配置文件中的设置引起的。在文件末尾的"数据输出配置"中,你会发现"reader.dmLevel=fun"。这意味着只会打印出功能(对整个声音文件而不是每帧采取的措施(。如果将其更改为"lld"(低级描述符(,它将逐帧打印出来。我认为这适用于所有表情库配置文件和emo_large文件。
Tl;dr -> 在配置文件的数据输出配置中将 reader.dmLevel=fun 更改为 reader.dmLevel=lld。