IBM Watson Speech to Text Audio/Basic 不接受窄带..WAV

我用Python 3.6编写了一个程序，它利用了IBM Watson的Speech to Text库。当程序搜索文件夹并单独读取每个.wav文件时，它应该检查文件的频率并以不同的方式标记我的IBM Watson集成。然后，它获取响应并将其映射到列表。通过存根测试，有问题的主要代码如下：

speech_to_text.set_detailed_response(True)
# Narrowband
if rate < 16000:
x = json.loads(
json.dumps(speech_to_text.recognize(audio_file, content_type='audio/basic', timestamps=True, max_alternatives=0).get_result(),
indent=2), object_hook=lambda d: namedtuple('X', d.keys())(*d.values())
)
# Broadband
else:
x = json.loads(
json.dumps(speech_to_text.recognize(audio_file, content_type='audio/wav', timestamps=True, max_alternatives=0).get_result(),
indent=2), object_hook=lambda d: namedtuple('X', d.keys())(*d.values())
)

当我为它提供超过 16 kbps 的文件时，该程序完全正常运行。但是，任何低于此值的内容，我都会收到此错误：

File "echo_cli.py", line 64, in <module>
json.dumps(speech_to_text.recognize(audio_file, content_type='audio/basic', timestamps=True, max_alternatives=0).get_result(),
File "C:Python37libsite-packageswatson_developer_cloudspeech_to_text_v1.py", line 373, in recognize
accept_json=True)
File "C:Python37libsite-packageswatson_developer_cloudwatson_service.py", line 479, in request
info=error_info, httpResponse=response)
watson_developer_cloud.watson_service.WatsonApiException: Error: This 8000hz audio input requires a narrow band model.  See https://<STT_API_ENDPOINT>/v1/models for a list of available models., Code: 400 , Information: {'code_description': 'Bad Request'} , X-dp-watson-tran-id: stream01-167902601 , X-global-transaction-id: f257b1145ba417780a01fd89

请注意，我使用的文件是通过网络驱动器进行的。但是，当我将它们复制到本地驱动器时，我收到相同的错误，因此我认为这是一个不相关的问题。我包含此文本以防万一它敲响了我不知道的任何铃铛。

根据这个文档，我应该能够接受一个带有audio/basic的窄带文件，并且根据我使用的打印命令，当我加载窄带.wav时，我的程序正在执行正确的代码。我做错了什么？

谢谢！

如果这是您要上传的文件类型，则只应传递audio/basicMIME类型(也称为" Sun .au"文件，它是最古老的音频文件类型之一(。如果要上传 WAV 文件，请将 MIME 类型指定为audio/wav，无论采样率如何。

相关内容

最新更新

热门标签：