Google Cloud Text to Speech (TTS) - 无法让音素正常工作



我正在使用Google的示例来实现音素,如下所示:

<phoneme alphabet="ipa" ph="t&#x259;mei&#x325;&#x27E;ou&#x325;"> tomato </phoneme>

我正在使用 Postman 作为 POST 请求发送到 https://texttospeech.googleapis.com/v1/text 端点。

我注意到,如果我更改单词"番茄">

但保留"ph"的原始值,则语音音频的单词"番茄"仍然会完全返回。我本来希望语音音频只返回"To"声音。

<phoneme alphabet="ipa" ph="t&#x259;"> tomato </phoneme>

通过邮递员以 JSON 格式发送 POST 请求时,我总是转义引号以避免 JSON 解析错误:

{
"audioConfig":{
"audioEncoding":"LINEAR16",
"volumeGainDb":"16",
"pitch": 0,
"speakingRate": 1
},
"input":{
"ssml":"<speak><phoneme alphabet="ipa" ph="t&#x259;"> tomato </phoneme></speak>" 
},
"voice":{
"languageCode":"en-US",
"name":"en-US-Wavenet-F",
"ssmlGender":"FEMALE"
}
}

有人知道为什么音素似乎不起作用吗?

提前谢谢。

Google Cloud Speech-to-Text 仅支持语音合成标记语言 (SSML( 标签的子集,不幸的是,<phoneme>目前不是其中之一。

您可以在此处找到支持哪些。

在 2020 年提出这个问题时不支持音素,但现在在 2021 年。请参阅此答案以获取一些要查找的陷阱。

相关内容

  • 没有找到相关文章

最新更新