小贝子编程

谷歌的WaveNet是否支持语音输入(SSML音素元素)？

本文关键字：SSML 元素 WaveNet 是否支持语音谷歌 text-to-speech ssml
更新时间 : 2023-09-15
英文 : Does Google's WaveNet support phonetic input (SSML phoneme elements)?

我正在使用一种产品，该产品使用语音输入使TTS为名称生成正确的发音。我在谷歌的WaveNet TTS文档中没有看到音素标签https://cloud.google.com/text-to-speech/docs/ssml，但也许我错过了。

如果谷歌的任何开发者都在听，他们能分享添加语音输入的计划吗？Tnx

由于它们基于"；端到端"；(text->net->sound(，他们可能从来没有像(text->音素->net->south(那样做过音素步骤。

这是高度期望的，因为音素选择应该是神经网络的工作，消除不必要的阶段。

最新更新

我的' collate_fn '函数在传递给Trainer函数的collate_fn参数时得到空数据
访问documentRoot以外的所有图像，而不是Apache windows
如何从React或Javascript中的对象属性中获取值
Redux工具箱:从切片文件导出一个自定义钩子来访问动作，而不是导出所有的动作，然后再次调用调度? &
CSS难题:孩子们总是闯入多行
贴现率，公式
使用 Javascript 的嵌套数组循环生成和排序所有象限中 (0,0) 周围的笛卡尔坐标
如何在Windows上添加现有的mysql模式
从Google VPS中恢复删除的文件夹
ffmpeg/映射代码的几个输出
r语言 - 在部署到shinyapps.io的Shiny应用中使用readClipboard()的问题 &
如何适应事件SelectionChange代码在事件计算工作?
类型错误：.map 不是一个函数不明白出了什么问题
在Rust中定义无限嵌套HashMap
为什么有些符号表达式没有简化？
如何在aws上自动执行jupyter笔记本?
form如何对一个已经存在的关系进行插入
在特定元素上拆分int数组
如何在supervisor中记录所有FATAL进程?
linux kernel fs/buffer.c 中的函数名称 "brelse" 代表什么？
使用lru_cache和__hash__缓存对象实例
是否可以在 CQL 中"get records older than N days"？
处理Rust中所谓的全局变量
如何在Javascript中连接for循环中的字符串
非原生Wordpress字段的Wordpress表单提交数据存储
ADB中未知命令tcip
如何编写一个检查输入是否符合语法的程序?
如何同时在不同的表中创建和更新数据- Laravel 9
如何将类方法作为事件添加到html按钮中
验证的最大字符数不能正常工作

谷歌的WaveNet是否支持语音输入(SSML音素元素)？

相关内容

最新更新

热门标签：