语音工作室中拒绝音频数据格式



我正在将音频数据的zip文件上传到Speech Studio中的Custom Speech项目。但是,上传后文件被拒绝。

我已经尝试了sox和ffmpeg来进行文件转换。sox的输出与文档页面上的要求相匹配。我不明白为什么这些文件被拒绝了。

sox.exe" --i audio1.wav

Input File     : 'audio1.wav'
Channels       : 1
Sample Rate    : 16000
Precision      : 16-bit
Duration       : 00:00:02.27 = 36320 samples ~ 170.25 CDDA sectors
File Size      : 72.7k
Bit Rate       : 256k
Sample Encoding: 16-bit Signed Integer PCM

我把文件压缩并上传。我相信这符合下面的要求。

File format RIFF (WAV)
Sample rate 8,000 Hz or 16,000 Hz
Channels    1 (mono)
Maximum length per audio    2 hours
Sample format   PCM, 16-bit
Archive format  .zip
Maximum archive size    2 GB

UI显示"上传数据失败。请检查您的数据格式,然后再次尝试上传。">

我只能相信服务有问题。

我对sox没有什么经验,但您使用ffmpeg时:ffmpeg.exe-i-ac 1-ar 16000

你可以在这里找到ffmpeg:https://www.ffmpeg.org/它是免费的。

希望这能有所帮助。

最新更新