语音识别与音频文件



我目前正在开发一个应用程序,需要在我的应用程序内录制音频,然后将剪辑发送到谷歌进行转录。有什么办法我可以发送音频剪辑,以语音处理文本?或者除了这个,还有其他方法可以将记录转换为文本吗?

Google的语音转文本API目前还没有公开发布,也没有关于在哪里可以使用的公告。在Android上,你可以使用系统语音识别功能,但它只能转录它自己录制的内容,你不能为它提供任何音频文件进行处理。

就目前而言,你要么需要使用其他服务,如at&t, IBM的沃森,Dragon听写(都是在线的),或者如果你绝对需要离线解决方案,可以考虑将Sphinx CMU纳入你的应用程序。

相关内容

  • 没有找到相关文章

最新更新