*没有编码经验,等等
我在 SSML 的中断语法中找到了答案,但不确定我是否可以将其与神经语音 (V3( 一起使用 + 不确定(如果对此处的问题是(,我可以在我的 curl 命令中插入这些中断语法
用于从API 文档进行语音合成的 cURL 命令 https://cloud.ibm.com/apidocs/text-to-speech#synthesize-audio-get
curl -X GET -u "apikey:{apikey}" --output hello_world.wav "{url}/v1/synthesize?accept=audio%2Fwav&text=Hello%20world&voice=en-US_AllisonV3Voice"
正在处理的文本是
text=Hello%20world
如果您需要添加SSML语音转换,例如。
<voice-transformation rate="slow">
Hello World
</voice-transformation>
然后,您需要将HTML字符转义为"
text=<voice-transformation rate="slow">Hello%20world<voice-transformation rate="slow">
制作完整的 cURL
curl -X GET -u "apikey:{apikey}" --output hello_world.wav "{url}/v1/synthesize?accept=audio%2Fwav&text=<voice-transformation rate="slow">Hello%20world<voice-transformation rate="slow">&voice=en-US_AllisonV3Voice"
目前只有 3 种声音可以像这样修改 - https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-transformation
- en-US_AllisonVoice
- en-US_LisaVoice
- en-US_MichaelVoice
所以没有神经声音。
上面的答案并不准确。您可以控制所有 IBM 语音的语速,只需使用韵律 SSML 标记:
<prosody rate="slow">Decrease speaking rate by 25%</prosody>