是否可以在不写入新文件的情况下将文本合成为语音?



我想使用 GCP 文本转语音 API 合成文本到语音,几乎我能找到的每个示例都会写入一个新文件,我想在函数被馈送文本并通过计算机扬声器读取时执行此操作。我一直在尝试转换说你好世界的 GCP 上传代码。我无法找到在转换后立即阅读它的方法。似乎 Watson 和 Azure 有这项服务,但 GCP 没有?

client = texttospeech.TextToSpeechClient(credentials=credentials)

synthesis_input = texttospeech.types.SynthesisInput(text=string)

voice = texttospeech.types.VoiceSelectionParams(
language_code='en-US',
ssml_gender=texttospeech.enums.SsmlVoiceGender.NEUTRAL)

audio_config = texttospeech.types.AudioConfig(
audio_encoding=texttospeech.enums.AudioEncoding.MP3)

response = client.synthesize_speech(synthesis_input, voice, audio_config)
with open('output.mp3', 'wb') as out:
out.write(response.audio_content)
print('Audio content written to file "output.mp3"')

任何帮助将不胜感激,我猜我缺少一些文档或简单的配置。

GCP 文本转语音 API 返回包含音频数据的响应。 您在返回时如何处理这些数据取决于您。 在上面的示例中,数据被写入文件。 如果您愿意,您可以大概可以将该数据传输到音频播放器以立即播放,而无需涉及文件。 数据格式的选择是WAV,MP3或OGG ...请参阅 https://cloud.google.com/text-to-speech/docs/reference/rest/v1beta1/text/synthesize#AudioEncoding。

至于播放音频数据的API...使用蟒蛇播放音频

相关内容

  • 没有找到相关文章

最新更新