语音识别代码只为我的2分钟wav文件提供几个单词



我正在运行以下代码来转换2分钟的语音。但是,它只返回几个字,并且看不到"Process finished with exit code 0"。较长的文件也会发生同样的情况。你认为这里可能有什么问题?谢谢

import speech_recognition as sr
def main():
sound = "XYZ.wav"
r = sr.Recognizer()
with sr.AudioFile(sound) as source :
r.adjust_for_ambient_noise(source)
print("Çalışıyor...")
audio = r.listen(source)
try:
print("Dönüştürülen ses : n " +r.recognize_google(audio, language = "tr-TR"))
except Exception as e:
print(e)
if __name__ == "__main__":
main()

文件很可能有错误的格式,扩展名没有任何意义。您可以先检查格式:

file XYZ.wav

它应该说像这个

RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 8000 Hz

如果没有,您需要将文件转换为pcm。

最新更新