算法非常简单的语音/语音识别

我正在为谷歌眼镜编写一款游戏，但不幸的是，语音识别器API在谷歌眼镜GDK的当前构建中不可用。

所以我一直在考虑实现一个非常简单的语音识别算法。假设我只想识别"是"one_answers"否"。
你知道任何示例代码或任何有用的资源来帮助我实现这个吗?是不是很难让我放弃这个想法，转而使用像CMUSphinx这样的大框架?

如何识别:上，下，右，左或数字从1到10 ?

据我所知，经常使用快速傅里叶变换(FFT)到频域的转换及其分析。还需要一些语音单词字典来进行频率关联。

请参阅此链接:

CMU Sphinx有java实现。

有David Wagner的好文章和matlab实现。

注:哦，如果你说俄语，为什么你不读这篇文章-很简单，用java的例子。

P.P.S.老实说，我从来没有使用过这个框架，但如果你对语音识别只有肤浅的了解，稳健和最简单的方法是使用现有的完整解决方案，如框架或库，否则你需要花时间掌握必要的知识门槛。在这种情况下，您可以阅读这篇文章

相关内容