Azure语音翻译:如何在检测到语音时才激活识别?



我目前正在开发一个实时翻译web应用程序,允许多个参与者使用Azure语音翻译并以多种语言共享他们的转录。

我不想按与会者人数X会议持续时间计费。因此问题:我如何激活识别时,仅检测语音?这样,我就只需要为正在讲话的人付费。

我试图使用来自TranslationRecognizer类的speechStartDetected事件,但此事件似乎仅当识别器当前正在识别(使用recognizeOnceAsync()startContinuousRecognitionAsync())时才会触发

语音SDK中是否有任何参数我可以用来实现我想要的?如果不是,我有什么选择?

可能可以观察音频dB级别并相应地激活连续识别,但我认为如果我尝试这样做会遇到一些问题。例:一旦音频水平达到一定的水平,在一定的持续时间内,这将触发startContinuousRecognitionAsync(),但它会错过演讲的开始…

提前感谢!

实时语音转文本解决方案,用于实时通话,语音转文本,您根据您转录的音频小时数付费。学习查看您的账单发票和使用数据https://learn.microsoft.com/en-us/azure/billing/billing-download-azure-invoice-daily-usage-date

最新更新