谷歌的WaveNet是否支持语音输入(SSML音素元素)?



我正在使用一种产品,该产品使用语音输入使TTS为名称生成正确的发音。我在谷歌的WaveNet TTS文档中没有看到音素标签https://cloud.google.com/text-to-speech/docs/ssml,但也许我错过了。

如果谷歌的任何开发者都在听,他们能分享添加语音输入的计划吗?Tnx

由于它们基于";端到端";(text->net->sound(,他们可能从来没有像(text->音素->net->south(那样做过音素步骤。

这是高度期望的,因为音素选择应该是神经网络的工作,消除不必要的阶段。

相关内容

  • 没有找到相关文章

最新更新