我正在尝试Microsoft认知服务,即 ASP.NET 核心中的说话人识别API。但是我不知道如何将音频文件作为以下受支持格式的输入:
集装箱 - WAV
编码 - PCM
速率 - 16K
示例格式 - 16 位
通道 - 单声道
有人可以帮我解决这个问题吗?
谢谢。
要将输入模式配置为 wav:
配置识别器的输入。
识别。SetInputToWaveFile(@"c:\temp\SampleWAVInput.wav"(;
本文讨论如何使用 System.Speech 命名空间中的识别器识别音频文件。
您也可以尝试使用输入格式的 SetInputToAudioStream((。