设置
我正在使用Google云平台通过Google Speech-to-text API将一些音频转换为文本文件。我一直收到错误:google.api_core.exceptions.InvalidArgument:400必须使用单声道(单声道(音频,但WAV标头指示1个声道。
这是我的代码:
config_wave_enhanced = speech.types.RecognitionConfig(
#sample_rate_hertz=44100,
encoding = 'LINEAR16',
enable_automatic_punctuation=True,
language_code='en-US',
#use_enhanched=True,
model='video',
enable_separate_recognition_per_channel = True,
audio_channel_count = 2
)
operation = speech_client.long_running_recognize(
config=config_wave_enhanced,
audio=long_audi_wave
)
response = str(operation.result(timeout=90))
有人能帮我解决这个错误吗?我在这里快疯了。
audio_channel_count = 1
可能会有所帮助。
将音频转换为单声道。可以使用命令行ffmpeg -i stereo.wav -ac 1 mono.wav
执行此操作。也将audio_channel_count = 1
设置为Christian Adib提到的。