检测原始音频(PCM)中的特定频率/音调



我记录了跨越几秒钟的音频,并包含两个具有相同频率的相似音调。他们相距几秒钟。我想做的是从第一个音调的末尾和第二个音调的开始,从这些音频文件分开的样本方面。假设在48kHz音频和字节阵列中签名16位PCM来表示原始音频。

我正在努力解决这个问题;

a)运行DFT以检测音调的特定频率的发生

b)由于两个音调最大,以某种方式找出峰以及它们在两个音调开始/结束的位置

c)通过频段通滤波器运行音频文件以滤除所有其他频率,我可能会以两行或两个非零段的最终形式

中的两个段

什么是最直接的方法(随时建议其他技术)?

通过快速的傅立叶变换运行样品,与您在某个公差内的预期频率匹配,然后在不匹配时计数样本数?

最新更新