请帮助选择将任何mp3文件转换为特殊.wav的解决方案 - 我是Linux命令行工具的新手,所以现在对我来说很难。
我需要从任何 mp3 文件中获取具有 16khz 单声道 16 位声音属性的 wav。我在努力
ffmpeg -i 111.mp3 -ab 16k out.wav,
但我得到了与 mp3 (22k) 相同的速率的 wav。
请帮助构建正确的命令行
> Kdazzle 的解决方案几乎就在那里 - 它仍然输出立体声 WAV,这是一个稍微修改的版本,可以生成单声道:
ffmpeg -i 111.mp3 -acodec pcm_s16le -ac 1 -ar 16000 out.wav
另外,如果这是用于预处理狮身人面像 4 的语音数据,请参阅此处:转换 CMU 狮身人面像 4 输入的音频文件
试试这个:
ffmpeg -i 111.mp3 -acodec pcm_s16le -ar 16000 out.wav
使用此示例:
import os
from pydub import AudioSegment
import numpy as np
from tqdm import tqdm
for src in tqdm (mp3_files):
des = src.replace('.mp3','.wav')
try:
sound = AudioSegment.from_mp3(src)
sound.set_channels(1)
sound = sound.set_frame_rate(16000)
sound = sound.set_channels(1)
sound.export(des, format="wav")
except:
print(src)
continue