我刚开始使用Azure认知服务(以及编程)。
Azure Text to Speech服务通过两个接口提供:Speech SDK和REST API。我想知道什么时候应该选择使用SDK或REST API?SDK相对于API有什么优势,反之亦然?
言论Azure SDK的文档是很模糊的。它说:
在某些情况下,你不能或不应该使用语音SDK。在这些情况下,您可以使用REST api访问Speech服务。例如,使用speech -to-text REST API v3.0进行批量转录和自定义语音。
对于上下文,我希望实现一个文本到语音的应用程序,该应用程序接受会话字符串的JSON,将每个字符串合成为语音文件并将其保存到云存储。到目前为止,我一直在本地使用语音SDK,并设法将语音文件保存到本地存储,但我需要在云中这样做。
让我知道如果我应该提供更多的细节,并提前感谢任何见解!
文档指的是REST API的使用,如果你想在批处理模式下转录或合成语音,即,不是实时的。如果您想要实时转录或合成结果,您应该使用SDK api。
查看文本到语音api的概述,包括批处理和实时的特定文档链接https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/text-to-speech