算法非常简单的语音/语音识别



我正在为谷歌眼镜编写一款游戏,但不幸的是,语音识别器API在谷歌眼镜GDK的当前构建中不可用。

所以我一直在考虑实现一个非常简单的语音识别算法。假设我只想识别"是"one_answers"否"。
你知道任何示例代码或任何有用的资源来帮助我实现这个吗?是不是很难让我放弃这个想法,转而使用像CMUSphinx这样的大框架?

如何识别:上,下,右,左或数字从1到10 ?

据我所知,经常使用快速傅里叶变换(FFT)到频域的转换及其分析。还需要一些语音单词字典来进行频率关联。

请参阅此链接:

CMU Sphinx有java实现。

有David Wagner的好文章和matlab实现。

注:哦,如果你说俄语,为什么你不读这篇文章-很简单,用java的例子。

P.P.S.老实说,我从来没有使用过这个框架,但如果你对语音识别只有肤浅的了解,稳健和最简单的方法是使用现有的完整解决方案,如框架或库,否则你需要花时间掌握必要的知识门槛。在这种情况下,您可以阅读这篇文章

最新更新