使用谷歌云语音将音频的特定部分转录为文本



我在文档中似乎找不到任何说明。我能够成功地从谷歌云存储中转录音频,但它转录了整个文件。为了节省成本,我想只转录音频的一部分,最好使用时间戳。有方法或变量可以做到这一点吗?

您可以按照注释中的建议,首先根据时间戳拆分音频文件。从这个Stackoverflow链接中获取的以下Python代码可以用于相同的操作。

from pydub import AudioSegment 
t1 = t1 * 1000 #Works in milliseconds
t2 = t2 * 1000 
newAudio = AudioSegment.from_wav("oldSong.wav") 
newAudio = newAudio[t1:t2] 
newAudio.export('newSong.wav', format="wav") #Exports to a wav file in the current path.

该代码使用Pydub库,该库支持WAV、mp3、flv等各种音频文件格式。

相关内容

  • 没有找到相关文章

最新更新