我正在尝试使用 xaudio2 使用 libav 播放音频。我正在使用的 xaudio2 代码适用于使用 avcodec_decode_audio2 的旧 ffmpeg,但已弃用avcodec_decode_audio4。我尝试遵循各种 libav 示例,但似乎无法播放音频。视频播放正常(或者更确切地说,它现在播放得很快,因为我还没有编写任何同步代码(。
首先音频被初始化,没有错误,视频被初始化,然后数据包:
while (1) {
//is this packet from the video or audio stream?
if (packet.stream_index == player.v_id) {
add_video_to_queue(&packet);
} else if (packet.stream_index == player.a_id) {
add_sound_to_queue(&packet);
} else {
av_free_packet(&packet);
}
}
然后在add_sound_to_queue:
int add_sound_to_queue(AVPacket * packet) {
AVFrame *decoded_frame = NULL;
int done = AVCODEC_MAX_AUDIO_FRAME_SIZE;
int got_frame = 0;
if (!decoded_frame) {
if (!(decoded_frame = avcodec_alloc_frame())) {
printf("[ADD_SOUND_TO_QUEUE] Out of memoryn");
return -1;
}
} else {
avcodec_get_frame_defaults(decoded_frame);
}
if (avcodec_decode_audio4(player.av_acodecctx, decoded_frame, &got_frame, packet) < 0) {
printf("[ADD_SOUND_TO_QUEUE] Error in decoding audion");
av_free_packet(packet);
//continue;
return -1;
}
if (got_frame) {
int data_size;
if (packet->size > done) {
data_size = done;
} else {
data_size = packet->size;
}
BYTE * snd = (BYTE *)malloc( data_size * sizeof(BYTE));
XMemCpy(snd,
AudioBytes,
data_size * sizeof(BYTE)
);
XMemSet(&g_SoundBuffer,0,sizeof(XAUDIO2_BUFFER));
g_SoundBuffer.AudioBytes = data_size;
g_SoundBuffer.pAudioData = snd;
g_SoundBuffer.pContext = (VOID*)snd;
XAUDIO2_VOICE_STATE state;
while( g_pSourceVoice->GetState( &state ), state.BuffersQueued > 60 ) {
WaitForSingleObject( XAudio2_Notifier.hBufferEndEvent, INFINITE );
}
g_pSourceVoice->SubmitSourceBuffer( &g_SoundBuffer );
}
return 0;
}
我似乎无法弄清楚问题所在,我在初始化,打开视频,编解码器处理等中添加了错误消息。如前所述,xaudio2 代码正在使用较旧的 ffmpeg,所以也许我错过了avcodec_decode_audio4的东西?
如果这个代码快照还不够,我可以发布整个代码,这些只是我认为问题会:(
解码后我没有看到您在任何地方访问decoded_frame
。否则,您希望如何获取数据?
BYTE * snd = (BYTE *)malloc( data_size * sizeof(BYTE));
这看起来也很可疑,因为data_size
是从数据包大小派生的。数据包大小是压缩数据的大小,它与解码后的PCM帧的大小关系不大。
解码的数据位于 decoded_frame->extended_data
中,这是一个指向数据平面的指针数组,有关详细信息,请参阅此处。解码数据的大小由 decoded_frame->nb_samples
确定。请注意,对于最近的 Libav 版本,许多解码器返回平面音频,因此不同的通道位于不同的数据缓冲区中。对于许多用例,您需要将其转换为交错格式,其中只有一个缓冲区包含所有通道。为此使用libavresample。