是否有一个适用于桌面或浏览器环境的已知API的全面列表?
我将在C、Java或PHP中重新散列并更新语音识别的答案?。这并不全面,但它可能是你的一个开始
在几个月的观察中,我看到大多数开发人员的选择都是这样的:
Windows用户-使用.Net或Microsoft.Speech的System.Speech功能,并安装Microsoft提供的免费识别器。Windows7包含一个完整的语音引擎。其他可以免费下载。对于称为SAPI的相同引擎,有一个C++API。请参阅http://msdn.microsoft.com/en-us/magazine/cc163663.aspx.或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。有关适用于Windows的Microsoft引擎的更多背景信息System.Speech.Recognition和Microsoft.Speech.Recognition之间有什么区别?
Linux用户——斯芬克斯似乎有很多追随者。看见http://cmusphinx.sourceforge.net/和http://cmusphinx.sourceforge.net/wiki/
商业产品-Nuance,Loquendo,AT&T、 IBM等。每种语言都提供自己的SDK和各种语言的库。
在线服务-Nuance、Yapme、ispeech.org、vlingo等。Nuance已经改进了他们的开发程序,现在将允许您免费访问他们的开发服务。Yap(我相信)最近被亚马逊收购了,所以我们可能会看到一些变化。
当然,这也可能有所帮助——http://en.wikipedia.org/wiki/List_of_speech_recognition_software
有一个Java语音API。请参阅Java speech API中的javax.speech.recognitionhttp://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html.我相信你仍然需要找到一个支持这个API的语音引擎。我不认为斯芬克斯完全支持它——http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi
还有许多其他SO难题:需要Linux的文本到语音和语音识别工具和pyspeech(python)-转录mp3文件?关于http://code.google.com/p/pyspeech/.你可能还想看看http://code.google.com/p/dragonfly/
文本到语音(语音生成)的领先API供应商是YAKiToMe!和iSpeech。YAKiToMe!是我使用的,因为我最喜欢他们的音质,而且价格最低(大部分是免费的)。他们支持说多种语言的男性和女性。一些声音供应商,如Acapella、Nuance、Loquendo和iVona,声音不错,但使用成本往往很高。
以下是如何做到这一点:注意:这是一个来自谷歌的api,所以它只适用于chrome浏览器。
(请参阅现场演示并在此处下载完整的源代码http://purpledesign.in/blog/?p=33)
定义按钮
<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />
并在javascript文件中定义要在函数中执行的操作
像这个
function processspeech()
{
var speechtext=$("#speech").val();
var elem = document.getElementById("test");
elem.value = speechtext;
var notification=""<span style="color:#F00; text-transform:uppercase;">"+ speechtext + "</span>" <br />*Is this what you said???";
notify(notification);
}
此处
<textarea> id="test"></textarea>
语音写入文本区域