语音识别时,TTS



我正在构建一个android应用程序,其中TTS(文本到语音)由语音命令控制。对于语音识别,我使用的是pocketsphinx,当TTS不活跃(即"开始"命令)时,它可以正常工作。然而,当TTS处于活动状态时(例如"stop"命令),识别的准确性会下降。

我试过使用AcousticEchoCanceler,但似乎没有帮助。你能告诉我吗?

  1. AEC应该从输入中过滤电话输出吗?是它不能很好地工作还是它不应该这样做?

  2. 我还应该尝试什么?

谢谢!

我们很快在聊天中与你讨论了这个问题。

AEC应该从输入中过滤电话输出吗?是它不能很好地工作还是它不应该这样做?

不,AEC不会过滤TTS。它消除了重复回波信号。

我还应该尝试什么?

你可能想先合成音频到一个文件:

如何将文本存储到语音输出为WAV文件?

然后播放。当你知道播放的是什么,你可以通过从录制的音频中减去最佳延迟来过滤它。否则,这是一个非常复杂的问题。

相关内容

  • 没有找到相关文章

最新更新