我正在尝试从麦克风和扬声器输出实时转换语音。目前,我正在尝试将两个扬声器的通话记录到wav文件中,并将其发送到Cognitive SDK进行转换。
有没有一种方法可以使用认知sdk转换扬声器设备的输出。链接到任何样本都会很有帮助。
请尝试使用Microsoft Bing Speech API。生成密钥并将其集成到您的网页上,它将实时将语音转换为文本。
https://azure.microsoft.com/en-in/services/cognitive-services/directory/speech/