我正在使用Google的示例来实现音素,如下所示:
<phoneme alphabet="ipa" ph="təmei̥ɾou̥"> tomato </phoneme>
我正在使用 Postman 作为 POST 请求发送到 https://texttospeech.googleapis.com/v1/text 端点。
我注意到,如果我更改单词"番茄">但保留"ph"的原始值,则语音音频的单词"番茄"仍然会完全返回。我本来希望语音音频只返回"To"声音。
<phoneme alphabet="ipa" ph="tə"> tomato </phoneme>
通过邮递员以 JSON 格式发送 POST 请求时,我总是转义引号以避免 JSON 解析错误:
{
"audioConfig":{
"audioEncoding":"LINEAR16",
"volumeGainDb":"16",
"pitch": 0,
"speakingRate": 1
},
"input":{
"ssml":"<speak><phoneme alphabet="ipa" ph="tə"> tomato </phoneme></speak>"
},
"voice":{
"languageCode":"en-US",
"name":"en-US-Wavenet-F",
"ssmlGender":"FEMALE"
}
}
有人知道为什么音素似乎不起作用吗?
提前谢谢。
Google Cloud Speech-to-Text 仅支持语音合成标记语言 (SSML( 标签的子集,不幸的是,<phoneme>
目前不是其中之一。
您可以在此处找到支持哪些。
在 2020 年提出这个问题时不支持音素,但现在在 2021 年。请参阅此答案以获取一些要查找的陷阱。