语音识别和获取用户媒体

我正在构建一个Web应用程序，并计划同时使用speechRecognition和navigator.getUserMedia进行音频输入。

我注意到我的桌面浏览器（Mac 上的 Chrome，v. 31.0.1650.63）两次请求使用麦克风的权限。虽然这对用户来说可能有点烦人，但语音识别和音频输入似乎都可以工作。

但是，如果我在Android上打开同一页面（Nexus 7，Android v4.4.2;Chrome v31.0.1650.59），它两次要求允许使用我的麦克风，但我只能使用两者之一（以先启动者为准）。有时，即使我允许访问麦克风，我也会收到语音识别error: "not-allowed"错误。

我做了一个jsFiddle，在这里：http://jsfiddle.net/5xBpW/

我的问题是：有没有办法在输入流上执行语音识别？或者有没有其他方法可以让这两个功能在 Chrome for Android 上运行？

您是否考虑过其他工具？Nuance（由现任Google工程主管Ray K创立）推出了一个令人兴奋的新工具/产品，它使用专有学习算法（例如机器智能）将语音数据转换为操作。

此工具了解上下文，并可以将其应用于特定操作，因此用户不必使用确切的短语：

https://developer.nuance.com/public/index.php?task=mix

游览： https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

缺点是你依赖第三方，但由于你正在查看的API也是实验性的，这可能会引起人们的兴趣。

相关内容

最新更新

热门标签：