音频转换器参考采样率转换 (iOS)



我编写了一个使用"novocaine"库来录制和播放声音的VoIP应用程序。我将采样率设置为8kHz。此采样率在音频流基本音频单元的描述中以新卡因和音频会话属性kAudioSessionProperty_PreferredHardwareSampleRate设置。我知道设置首选硬件采样率并不能保证实际的硬件采样率会改变,但它适用于除 iPhone6s 和 iPhone6s+ 以外的所有设备(当路由更改为扬声器时)。使用iPhone6s(+)和扬声器路由,我从麦克风接收48kHz的声音。所以我需要以某种方式将这个 48 kHz 的声音转换为 8kHz。在文档中,我发现在这种情况下可以使用 AudioConverterRef,但我在使用它时遇到了麻烦。

我使用 AudioConverterFillComplexBuffer 进行采样率转换,但它总是返回 -50 OSStatus(传递给函数的一个或多个参数无效)。这就是我使用音频转换器的方式:

// Setup AudioStreamBasicDescription for input
inputFormat.mSampleRate = 48000.0;
inputFormat.mFormatID = kAudioFormatLinearPCM;
inputFormat.mFormatFlags = kAudioFormatFlagIsFloat | kAudioFormatFlagsNativeEndian | kAudioFormatFlagIsPacked;
inputFormat.mChannelsPerFrame = 1;
inputFormat.mBitsPerChannel = 8 * sizeof(float);
inputFormat.mFramesPerPacket = 1;
inputFormat.mBytesPerFrame = sizeof(float) * inputFormat.mChannelsPerFrame;
inputFormat.mBytesPerPacket = inputFormat.mBytesPerFrame * inputFormat.mFramesPerPacket;
// Setup AudioStreamBasicDescription for output
outputFormat.mSampleRate = 8000.0;
outputFormat.mFormatID = kAudioFormatLinearPCM;
outputFormat.mFormatFlags = kAudioFormatFlagIsFloat | kAudioFormatFlagsNativeEndian | kAudioFormatFlagIsPacked;
outputFormat.mChannelsPerFrame = 1;
outputFormat.mBitsPerChannel = 8 * sizeof(float);
outputFormat.mFramesPerPacket = 1;
outputFormat.mBytesPerFrame = sizeof(float) * outputFormat.mChannelsPerFrame;
outputFormat.mBytesPerPacket = outputFormat.mBytesPerFrame * outputFormat.mFramesPerPacket;

// Create new instance of audio converter
AudioConverterNew(&inputFormat, &outputFormat, &converter);
// Set conversion quality
UInt32 tmp = kAudioConverterQuality_Medium;
AudioConverterSetProperty( converter, kAudioConverterCodecQuality,
                          sizeof( tmp ), &tmp );
AudioConverterSetProperty( converter, kAudioConverterSampleRateConverterQuality, sizeof( tmp ), &tmp );
// Get the size of the IO buffer(s)
UInt32 bufferSizeFrames = 0;
size = sizeof(UInt32);
AudioUnitGetProperty(self.inputUnit,
                                 kAudioDevicePropertyBufferFrameSize,
                                 kAudioUnitScope_Global,
                                 0,
                                 &bufferSizeFrames,
                                 &size);
UInt32 bufferSizeBytes = bufferSizeFrames * sizeof(Float32);
// Allocate an AudioBufferList plus enough space for array of AudioBuffers
UInt32 propsize = offsetof(AudioBufferList, mBuffers[0]) + (sizeof(AudioBuffer) * outputFormat.mChannelsPerFrame);
// Malloc buffer lists
convertedInputBuffer = (AudioBufferList *)malloc(propsize);
convertedInputBuffer->mNumberBuffers = 1;
// Pre-malloc buffers for AudioBufferLists
convertedInputBuffer->mBuffers[0].mNumberChannels = outputFormat.mChannelsPerFrame;
convertedInputBuffer->mBuffers[0].mDataByteSize = bufferSizeBytes;
convertedInputBuffer->mBuffers[0].mData = malloc(bufferSizeBytes);
memset(convertedInputBuffer->mBuffers[0].mData, 0, bufferSizeBytes);
// Setup callback for converter
static OSStatus inputProcPtr(AudioConverterRef               inAudioConverter,
                                 UInt32*                         ioNumberDataPackets,
                                 AudioBufferList*                ioData,
                                 AudioStreamPacketDescription* __nullable* __nullable  outDataPacketDescription,
                                 void* __nullable                inUserData)
{
    // Read data from buffer
}
// Perform actual sample rate conversion
AudioConverterFillComplexBuffer(converter, inputProcPtr, NULL, &numberOfFrames, convertedInputBuffer,  NULL)

输入ProcPtr回调永远不会被调用。我尝试设置不同的帧数,但仍然收到 OSStatus -50。

1)使用AudioConverterRef是进行采样率转换的正确方法,还是可以用不同的方式完成?

2) 我的转换实现有什么问题?

提前谢谢大家

一个问题是:

AudioUnitGetProperty(self.inputUnit,
                             kAudioDevicePropertyBufferFrameSize,
                             kAudioUnitScope_Global,
                             0,
                             &bufferSizeFrames,
                             &size);

kAudioDevicePropertyBufferFrameSize是 OSX 属性,在 iOS 上不存在。这段代码是如何编译的?

如果您以某种方式对其进行了编译,请检查此函数的返回代码!我有一种感觉,它失败了,bufferSizeFrames是零。这将使AudioConverterFillComplexBuffer返回-50(kAudio_ParamError)。

所以在iOS上,要么自己选择一个bufferSizeFrames,要么基于AVAudioSession IOBufferDuration,如果你必须的话。

另一个问题:检查您的返回代码。全部!

例如

UInt32 tmp = kAudioConverterQuality_Medium;
AudioConverterSetProperty( converter, kAudioConverterCodecQuality,
                      sizeof( tmp ), &tmp );

我很确定在LPCM->LPCM转换中没有编解码器可言,并且在任何情况下,kAudioConverterQuality_Medium都不是与kAudioConverterCodecQuality一起使用的正确值。我不明白这个电话如何成功。

最新更新