小贝子编程

音频文件中的静音/暂停会导致 Google 语音转文本转录提前结束

本文关键字：语音 Google 文本结束文件暂停音频 python python-3.x google-cloud-speech
更新时间 : 2023-09-12
英文 : Silence/Pauses in audio file leads to Google Speech to Text transcription ending early

我正在使用Google语音到文本API使用Python3中的同步识别意图来转换FLAC音频文件。但是，当音频文件包含短暂的停顿或静音时，听录会提前结束，并且响应不会在暂停/静音后捕获文本。

        audiofile = self.convert_mp3_to_flac(audiofile)
        with io.open(audiofile, 'rb') as audio_file:
            content = audio_file.read()
        audio = types.RecognitionAudio(content=content)
        config = types.RecognitionConfig(
            encoding=enums.RecognitionConfig.AudioEncoding.FLAC,
            sample_rate_hertz=24000,
            language_code='en-US',
            enable_automatic_punctuation=True)
        response = self.client.recognize(config, audio)

响应对象不包含音频文件中静音后的语音听录。

我希望看到整个转录，因为我正在使用整个音频文件发出请求。

音频源是否使用降噪麦克风产生？一种解决方法是在音频中添加一些白噪声。

音频文件中的静音/暂停会导致 Google 语音转文本转录提前结束

相关内容

最新更新

热门标签：