我有几百个wav文件,我正在构建一个自动编码器。但我无法将所有的。wav文件加载到笔记本电脑中,因为它很快就会崩溃。我如何加载数据到tensorflow.data.dataset?
要加载音频文件,您将使用tf.audio.decode_wav
,它将waw编码的音频作为张量和采样率返回。更多关于图书馆的信息可以在这里找到。
def decode_audio(audio_binary):
audio, _ = tf.audio.decode_wav(audio_binary)
return tf.squeeze(audio, axis=-1)
读取音频文件及其标签的说明在这里。