我应该使用哪种工具来录制音频(或转换录制的音频),以Microsoft说话人识别 API 支持的格式?



我正在尝试Microsoft认知服务,即 ASP.NET 核心中的说话人识别API。但是我不知道如何将音频文件作为以下受支持格式的输入:

集装箱 - WAV

编码 - PCM

速率 - 16K

示例格式 - 16 位

通道 - 单声道

有人可以帮我解决这个问题吗?

谢谢。

要将输入模式配置为 wav:

配置识别器的输入。

识别。SetInputToWaveFile(@"c:\temp\SampleWAVInput.wav"(;

本文讨论如何使用 System.Speech 命名空间中的识别器识别音频文件。

您也可以尝试使用输入格式的 SetInputToAudioStream((。

相关内容

  • 没有找到相关文章

最新更新