我如何从麦克风解释音频流来检测WP7中的某个声音



我正在使用http://msdn.microsoft.com/en-us/library/gg442302(v=vs.92).aspx的基本方法来访问麦克风。但我在试着检测一种特定声音的出现,比如拍手声。人们如何解读麦克风发出的声音呢?缓冲区中的浮点数究竟代表什么?

谢谢

我想这可能会有帮助http://en.wikipedia.org/wiki/Pulse-code_modulation。我认为这些值在某种程度上代表了麦克风中机械部分从其中间位置的偏移,但我相信理论和词汇可能会非常深入。

当涉及到识别声音时-它也可以变得任意复杂,但拍子可能是一项简单的任务-你基本上想检测音量的突然增加,这将表现为流中绝对值的移动平均值的急剧短期增加,所以我在流上放了一个滑动窗口,并不断检查某些阈值-一个短窗口用于高音量阈值,两个相邻的,更长的和更低的阈值窗口,以确保在拍手前后没有这样的噪音。

最新更新