我想使用Sphinx进行语音识别。
我希望使用Java或Python捕获Ekiga VOIP软电话的输出/传入音频,并将其传递给Sphinx。现在,输出指向PulseAudio JACK接收器。
如果我没有使用正确的术语,我很抱歉,因为我在这方面很不在行。
如果你能给我指明正确的方向,我将不胜感激,谢谢。
您需要正确地形成您想要实现的任务,并为此选择合适的工具。软件开发人员不会在他们的项目中使用像Ekiga这样的桌面应用程序。这只是因为桌面应用程序是为用户编写的,而不是为软件开发人员编写的。您只能在源代码中修改像Ekiga这样的桌面应用程序,但这完全是另一回事。
如果你想拥有一个VOIP端点并将其连接到语音识别服务,你需要查看IVR系统和类似的东西。IVR系统是通过VOIP协议实现复杂交互的特定工具。例如:
自由切换
Asterisk
GNU Gatekeeper-一个项目建立在与Ekiga 相同的Opal技术上
您可以设置freeswitch以等待呼叫,并将它们传递给pcketsphinx。Asterisk也可以这样做。有关更多详细信息,请参阅
如何使用来自Freeswitch 的Pocketpshinx
如何使用UniMRCP项目在Asterisk中集成Pocketsphinx