Google Cloud Text to Speech (TTS) - 无法让音素正常工作 - Google Cloud Text to Speech (TTS)

我正在使用Google的示例来实现音素，如下所示：

<phoneme alphabet="ipa" ph="t&#x259;mei&#x325;&#x27E;ou&#x325;"> tomato </phoneme>

我正在使用 Postman 作为 POST 请求发送到 https://texttospeech.googleapis.com/v1/text 端点。

我注意到，如果我更改单词"番茄">

但保留"ph"的原始值，则语音音频的单词"番茄"仍然会完全返回。我本来希望语音音频只返回"To"声音。

<phoneme alphabet="ipa" ph="t&#x259;"> tomato </phoneme>

通过邮递员以 JSON 格式发送 POST 请求时，我总是转义引号以避免 JSON 解析错误：

{
"audioConfig":{
"audioEncoding":"LINEAR16",
"volumeGainDb":"16",
"pitch": 0,
"speakingRate": 1
},
"input":{
"ssml":"<speak><phoneme alphabet="ipa" ph="t&#x259;"> tomato </phoneme></speak>" 
},
"voice":{
"languageCode":"en-US",
"name":"en-US-Wavenet-F",
"ssmlGender":"FEMALE"
}
}

有人知道为什么音素似乎不起作用吗？

提前谢谢。

Google Cloud Speech-to-Text 仅支持语音合成标记语言 (SSML( 标签的子集，不幸的是，<phoneme>目前不是其中之一。

您可以在此处找到支持哪些。

在 2020 年提出这个问题时不支持音素，但现在在 2021 年。请参阅此答案以获取一些要查找的陷阱。

Google Cloud Text to Speech (TTS) - 无法让音素正常工作

相关内容

最新更新

热门标签：