我有一个使用TTS API的小独立项目,在某些情况下,我想使用SSML来改变文本的阅读方式,但尽量保持在4M字符/月的配额下,以避免收取(可能是一大笔(费用。
我想知道是否所有的标记都计入配额,但找不到任何有关这方面的详细信息。
示例:
(21个字符(
This is a test. Boop!
与
(141个字符(
<speak>This is a <prosody rate="50%">test.</prosody> <audio src="https://some website/boop.wav">Boop!</audio></speak>
当我查看控制台时,我实际上看不到任何关于字符使用的信息,(总是说"这段时间没有数据"(我从来都不知道在一个月内我离超过这个限制有多近。因此,如果添加对此的支持,配额使用量将增加约5倍,我想知道。
每分钟请求的配额:https://i.stack.imgur.com/BpIkF.png
所有请求中的字符数:https://i.stack.imgur.com/jfuKe.png
此外,如果有人碰巧知道字符计数的事情是怎么回事,我很想听听。
根据此文本到语音定价GCP文档,语音合成标记语言(SSML(标记也包含在计费的字符数中,因此您可能需要相应地增加配额。有关在"文本到语音"中使用SSML的最佳实践和提示,您可以参阅本文档。