使用 Microsoft Azure (REST API) 进行批量听录



我想使用 REST Microsoft API 转录更长的音频文件(至少 5 分钟(。有很多不同的产品和名称,例如语音服务 API 或必应语音 API。到目前为止,我尝试过的 REST API 都不支持转录更长的音频文件。

文档指出,有一个 REST API 完全适用于这种情况: https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

此服务的终结点是什么?

GitHub上有一个示例:https://github.com/PanosPeriorellis/Speech_Service-BatchTranscriptionAPI

终结点是 CRIS 的终结点,如以下代码所示:

private const string HostName = "cris.ai";
// ...
var client = CrisClient.CreateApiV2Client(SubscriptionKey, HostName, Port);

然后我在文档中发现 API 在 Swagger 上公开(链接可见此处(,因此更容易探索可用的方法(从 2.0beta 切换到顶部的 2.0

(:
  • 西欧:https://westeurope.cris.ai/swagger/ui/index
  • 美国西部 : https://westus.cris.ai/swagger/ui/index

因此,要创建新的听录,路径为:/api/speechtotext/v2.0/transcriptions,使用 POST 方法调用,因此完整端点为:

  • 西欧:https://westeurope.cris.ai/api/speechtotext/v2.0/transcriptions
  • 美国西部 : https://westus.cris.ai/api/speechtotext/v2.0/transcriptions

请注意,使用转录所需的订阅密钥级别必须是Standard级别定价S0,而不是Free级别。

最新更新