在Android TextToSpeech中,syntheToFile生成的标准音频格式是什么



使用Android TextToSpeech的synthesizeToFile方法,我们如何知道生成的文件格式(WAV、MP3、OGG(和/或属性(采样率、比特深度等(?

我在文档中找不到明确的标准。。。它甚至没有承诺任何特定的文件格式,例如WAV。

这仅仅取决于语音引擎如何选择来实现吗?

如果我们想对结果做点什么,比如计算文件的持续时间,该怎么办?我们必须提前了解有关文件格式的详细信息。由于无法知道最终用户的设备上安装/运行的是什么引擎,这使得情况变得更加不可预测。

这真的没有标准吗?

在android文档中关于synthesizeToFile。你可以在filename中看到一个建议格式参数是.wav

音频的属性取决于您的输入源,或者您可以使用Voice进行设置。保存成功后,您可以获取音频文件的信息。示例:您可以使用MediaPlayer来获取格式、持续时间、比特率。。。

您还可以使用AudioTrack通过读取音频缓冲区来播放原始数据。AudioTrack是播放原始音频字节的标准

最新更新