以Android语音识别发送到云的语音是什么格式



我正在构建一个包括语音识别的应用程序 - 我打算使用Android语音识别服务或语音键入功能。

根据我阅读的内容,演讲主要是在云中处理的。我的问题是有人是否知道音频将哪种格式发送到云中?例如,是像WAV,MP3或PCM之类的东西,还是可能完全是其他东西?

我承认,这主要是出于清晰的好奇心,以了解幕后发生的事情。(但部分原因也涉及对处理前和后处理对识别的影响的兴趣。)

好吧,我也一直在寻找该信息,而我最接近的是Google使用FLAC音频编解码器的Google的语音识别API。我不确定Android是否也使用它,但这是我有史以来最接近的东西。

最新更新