什么是使用已知词典的语音文字的最佳算法

我已经看到了很多问题，并且阅读了很多文章，但仍然找不到我想要的最佳命令。我想构建具有此功能的应用程序（android/ios/... whyth）：当用户写下文本（使用Killboard）时，该应用程序可以识别出关于他写的99.9％性能的文字的演讲，我不介意他是否必须先记录他的Voise才能使性能变得更好...我想要它像Google的服务一样是"现场"，与Seri不同，只有在您结束后才写文本。我找到了这个网站：http://cmusphinx.sourceforge.net我希望开始使用它，但是在开始之前，我想确保这是最好的方法。谁能给出一些建议？谢谢*编辑：如果需要的话，我不在乎为新的launguage构建一个新领域（不是英语）。

我的意思是，如果您进行一些研究，您会发现语音到文本的99％精度只是最近的事情，一个例子就是Nuance的龙。p>高精度的语音到文本的许可费用约为600美元。创建这不是一件容易的事。您必须为高精度TTS库付费。

对于您正在做的事情，我使用的一项非常好的服务是Wit.ai。它非常准确，并且每周都会变得更快。

您可能是AT＆amp; t语音引擎（沃森）的另一种可能性：http：//developer.att.com/他们每月提供100万个API电话费（低），并允许您自定义您用来识别演讲的"库"。鉴于您的最新陈述，这可能是您正在寻找的东西。您可以免费尝试直到付款。

相关内容

最新更新

热门标签：