我遵循了(https://www.mathworks.com/help/signal/ref/stftmag2sig.html)根据声音构造声谱图。我已经将光谱图导出并保存为png图像。我现在想要的是,在matlab或任何其他平台中导入图像,并从中构建音频。我已经阅读了许多帖子和阅读材料,但它们不涉及从图像生成音频。大多数情况下,它们依赖于声音信息进行重建,而声谱图只是出于可视化目的而出现的。附上未标记的.png图像以供参考。
在您引用的文档之后:
s = imread('im.png') // see remarks below
x = stftmag2sig(s,nfft) // x is your audio
s
就是你的形象。OP产生这些频谱图,因此他控制输出。基于此:
- 避免有损的图像格式,并确保没有重新缩放/插值。您的像素应该包含来自给定时间窗口(
nfft
(和频率仓的振幅 - 要么只生成光谱图(没有轴(的图像,要么知道光谱图的确切坐标
- 不要在光谱图中使用颜色。它看起来不错,但在如何将三元组颜色映射到振幅方面引入了完全不必要的模糊性