如何通过 curl 调整 Watson 的文本转语音服务中的语速?



*没有编码经验,等等

我在 SSML 的中断语法中找到了答案,但不确定我是否可以将其与神经语音 (V3( 一起使用 + 不确定(如果对此处的问题是(,我可以在我的 curl 命令中插入这些中断语法

用于从API 文档进行语音合成的 cURL 命令 https://cloud.ibm.com/apidocs/text-to-speech#synthesize-audio-get

curl -X GET -u "apikey:{apikey}" --output hello_world.wav "{url}/v1/synthesize?accept=audio%2Fwav&text=Hello%20world&voice=en-US_AllisonV3Voice"

正在处理的文本是

text=Hello%20world

如果您需要添加SSML语音转换,例如。

<voice-transformation rate="slow">
Hello World
</voice-transformation>

然后,您需要将HTML字符转义为"

text=&lt;voice-transformation rate=&quot;slow&quot;&gt;Hello%20world&lt;voice-transformation rate=&quot;slow&quot;&gt;

制作完整的 cURL

curl -X GET -u "apikey:{apikey}" --output hello_world.wav "{url}/v1/synthesize?accept=audio%2Fwav&amp;text=&lt;voice-transformation rate=&quot;slow&quot;&gt;Hello%20world&lt;voice-transformation rate=&quot;slow&quot;&gt;&amp;voice=en-US_AllisonV3Voice"

目前只有 3 种声音可以像这样修改 - https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-transformation

  • en-US_AllisonVoice
  • en-US_LisaVoice
  • en-US_MichaelVoice

所以没有神经声音。

上面的答案并不准确。您可以控制所有 IBM 语音的语速,只需使用韵律 SSML 标记:

<prosody rate="slow">Decrease speaking rate by 25%</prosody>

相关内容

  • 没有找到相关文章

最新更新