在Android TextToSpeech中，syntheToFile生成的标准音频格式是什么

使用Android TextToSpeech的synthesizeToFile方法，我们如何知道生成的文件格式(WAV、MP3、OGG(和/或属性(采样率、比特深度等(？

我在文档中找不到明确的标准。。。它甚至没有承诺任何特定的文件格式，例如WAV。

这仅仅取决于语音引擎如何选择来实现吗？

如果我们想对结果做点什么，比如计算文件的持续时间，该怎么办？我们必须提前了解有关文件格式的详细信息。由于无法知道最终用户的设备上安装/运行的是什么引擎，这使得情况变得更加不可预测。

这真的没有标准吗？

在android文档中关于synthesizeToFile。你可以在filename中看到一个建议格式参数是.wav

音频的属性取决于您的输入源，或者您可以使用Voice进行设置。保存成功后，您可以获取音频文件的信息。示例：您可以使用MediaPlayer来获取格式、持续时间、比特率。。。

您还可以使用AudioTrack通过读取音频缓冲区来播放原始数据。AudioTrack是播放原始音频字节的标准

相关内容