Azure语音翻译:如何在检测到语音时才激活识别?

我目前正在开发一个实时翻译web应用程序，允许多个参与者使用Azure语音翻译并以多种语言共享他们的转录。

我不想按与会者人数X会议持续时间计费。因此问题:我如何激活识别时，仅检测语音?这样，我就只需要为正在讲话的人付费。

我试图使用来自TranslationRecognizer类的speechStartDetected事件，但此事件似乎仅当识别器当前正在识别(使用recognizeOnceAsync()或startContinuousRecognitionAsync())时才会触发

语音SDK中是否有任何参数我可以用来实现我想要的?如果不是，我有什么选择?

可能可以观察音频dB级别并相应地激活连续识别，但我认为如果我尝试这样做会遇到一些问题。例:一旦音频水平达到一定的水平，在一定的持续时间内，这将触发startContinuousRecognitionAsync()，但它会错过演讲的开始…

提前感谢!

实时语音转文本解决方案，用于实时通话，语音转文本，您根据您转录的音频小时数付费。学习查看您的账单发票和使用数据https://learn.microsoft.com/en-us/azure/billing/billing-download-azure-invoice-daily-usage-date

相关内容

最新更新

热门标签：