什么是使用已知词典的语音文字的最佳算法



我已经看到了很多问题,并且阅读了很多文章,但仍然找不到我想要的最佳命令。我想构建具有此功能的应用程序(android/ios/... whyth):当用户写下文本(使用Killboard)时,该应用程序可以识别出关于他写的99.9%性能的文字的演讲,我不介意他是否必须先记录他的Voise才能使性能变得更好...我想要它像Google的服务一样是"现场",与Seri不同,只有在您结束后才写文本。我找到了这个网站:http://cmusphinx.sourceforge.net我希望开始使用它,但是在开始之前,我想确保这是最好的方法。谁能给出一些建议?谢谢*编辑:如果需要的话,我不在乎为新的launguage构建一个新领域(不是英语)。

我的意思是,如果您进行一些研究,您会发现语音到文本的99%精度只是最近的事情,一个例子就是Nuance的龙。p>高精度的语音到文本的许可费用约为600美元。创建这不是一件容易的事。您必须为高精度TTS库付费。

对于您正在做的事情,我使用的一项非常好的服务是Wit.ai。它非常准确,并且每周都会变得更快。

您可能是AT& t语音引擎(沃森)的另一种可能性:http://developer.att.com/他们每月提供100万个API电话费(低),并允许您自定义您用来识别演讲的"库"。鉴于您的最新陈述,这可能是您正在寻找的东西。您可以免费尝试直到付款。

最新更新