谷歌语音到文本:无效参数:400必须使用单声道(单声道)音频,但WAV标头指示1个声道



我正在使用Google云平台通过Google Speech-to-text API将一些音频转换为文本文件。我一直收到错误:google.api_core.exceptions.InvalidArgument:400必须使用单声道(单声道(音频,但WAV标头指示1个声道。

这是我的代码:

config_wave_enhanced = speech.types.RecognitionConfig(
#sample_rate_hertz=44100,
encoding = 'LINEAR16',
enable_automatic_punctuation=True,
language_code='en-US',
#use_enhanched=True,
model='video',
enable_separate_recognition_per_channel = True,
audio_channel_count = 2
)
operation = speech_client.long_running_recognize(
config=config_wave_enhanced,
audio=long_audi_wave
)
response = str(operation.result(timeout=90))

有人能帮我解决这个错误吗?我在这里快疯了。

设置audio_channel_count = 1可能会有所帮助。

将音频转换为单声道。可以使用命令行ffmpeg -i stereo.wav -ac 1 mono.wav执行此操作。也将audio_channel_count = 1设置为Christian Adib提到的。

相关内容

  • 没有找到相关文章

最新更新