在谷歌云文本到语音更好的质量



我正在为我的Adalo应用程序使用Integromat中的谷歌云文本到语音模块。我想有更好的音频质量,所以我已经切换到WaveNet,并将采样率提高到48000赫兹,但它的质量仍然很差。我能做什么?每一个想法都非常感谢,提前感谢!

谨致问候,Ben

您可能需要指定effectsProfileId,如https://cloud.google.com/text-to-speech/docs/audio-profiles

const effectsProfileId = ['telephony-class-application'];
const request = {
input: {text: text},
voice: {languageCode: languageCode, ssmlGender: ssmlGender},
audioConfig: {audioEncoding: 'MP3', effectsProfileId: effectsProfileId},
};

语音质量的高低取决于你所说的通过哪种设备播放音频。

将数据转换为谷歌推荐的编码。我们的格式与谷歌文档中提到的相同,比如Flac格式。这将提供适当的准确性。使用立体声录音,将香奈儿的扬声器分开。

最新更新