只是出于好奇,因为我一直想知道这一点。应用程序 Shazam 如何工作?我知道如何使用它,我说的是编程。应用程序如何收听歌曲的任何部分,然后为您提供结果?显然,它从数据库中接收它的歌曲信息,但是没有人可以在该数据库中输入人类已知的每首歌曲。另外,Shazam 如何不一直不断更新?新歌不断发布,但就像 Shazam 已经将未来的歌曲编程到其中一样。这对我来说简直令人难以置信,我只是想知道这一切究竟是如何运作的。我知道这不是一个帮助问题,但有人可以澄清一下吗?谢谢!
Shazam只从傅里叶变换开始(这并不奇怪,因为几乎所有的音频处理都是这样工作的(。
如果你愿意,你可以阅读Avery Wang的原始论文。 他是Shazam算法的发明者。 我碰巧认为最好将其解释为最近邻技术,这就是为什么我们将其作为示例包含在"数据挖掘技术,第 3 版"的第 9 章中。
您可能对我们在那里要说的话感兴趣(http://www.amazon.com/Data-Mining-Techniques-Relationship-Management/dp/0470650931/ref=pd_sim_b_5(。
他们在 diciu 发布的链接上没有说太多。
该算法基于傅里叶波,允许将数学函数表示为调和函数的线性和。这种转换允许在时间到频率之间进行映射,这正是您创建语音识别所需要的。
我发现很难相信沙赞对傅立叶变换有专利。但是,如果您尝试建立"第二个Shazaam",您可能会失败,因为他们已经占领了所有市场......