在线语音识别(类似于谷歌语音搜索)



我一直在尝试找到用于在线语音识别的mehthod,例如:与Google语音搜索非常相似,不需要用户安装任何插件/软件/闪存。用户只需插入麦克风并说出一些内容即可识别文本。

我想到了这种方法,但不知道这是否正确。我构建了一个 dll,它可以获取输入音频流并从音频中输出已识别的 txt。我在 ASP.NET 引用中引用了这个 dll,并进一步考虑将音频文件从用户端上传到服务器,然后使用"识别器"dll。我不确定这种方法是否正确?还有其他方法可以遵循吗?
最主要的是我不能让用户为此实现安装任何东西或任何依赖项,例如 flash/silverlight 等。

如果您可以指定您的用户使用 Chrome 11 或更高版本,则可以使用 Google 的 webkit 为您的应用启用语音。这是有关如何使用webkit进行语音的链接。这利用了 HTML5 中可用的音频输入功能。如果你看看这个博客,它会解释它是如何工作的,因为作者对它进行了逆向工程。它从浏览器中的用户获取音频输入,并将其发送到服务进行处理,并以 JSON 消息的形式返回结果。正如你所建议的那样,你可以在服务器端构建自己的服务,以模仿谷歌正在做的事情。 为语音识别构建可扩展的服务将是一项不小的壮举。

最新更新