Azure文本到语音SDK与API:何时使用哪个?

我刚开始使用Azure认知服务(以及编程)。

Azure Text to Speech服务通过两个接口提供:Speech SDK和REST API。我想知道什么时候应该选择使用SDK或REST API?SDK相对于API有什么优势，反之亦然?
言论Azure SDK的文档是很模糊的。它说:

在某些情况下，你不能或不应该使用语音SDK。在这些情况下，您可以使用REST api访问Speech服务。例如，使用speech -to-text REST API v3.0进行批量转录和自定义语音。

对于上下文，我希望实现一个文本到语音的应用程序，该应用程序接受会话字符串的JSON，将每个字符串合成为语音文件并将其保存到云存储。到目前为止，我一直在本地使用语音SDK，并设法将语音文件保存到本地存储，但我需要在云中这样做。

让我知道如果我应该提供更多的细节，并提前感谢任何见解!

文档指的是REST API的使用，如果你想在批处理模式下转录或合成语音，即，不是实时的。如果您想要实时转录或合成结果，您应该使用SDK api。

查看文本到语音api的概述，包括批处理和实时的特定文档链接https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/text-to-speech

相关内容