音频转换器参考采样率转换 (iOS)

我编写了一个使用"novocaine"库来录制和播放声音的VoIP应用程序。我将采样率设置为8kHz。此采样率在音频流基本音频单元的描述中以新卡因和音频会话属性kAudioSessionProperty_PreferredHardwareSampleRate设置。我知道设置首选硬件采样率并不能保证实际的硬件采样率会改变，但它适用于除 iPhone6s 和 iPhone6s+ 以外的所有设备（当路由更改为扬声器时）。使用iPhone6s（+）和扬声器路由，我从麦克风接收48kHz的声音。所以我需要以某种方式将这个 48 kHz 的声音转换为 8kHz。在文档中，我发现在这种情况下可以使用 AudioConverterRef，但我在使用它时遇到了麻烦。

我使用 AudioConverterFillComplexBuffer 进行采样率转换，但它总是返回 -50 OSStatus（传递给函数的一个或多个参数无效）。这就是我使用音频转换器的方式：

// Setup AudioStreamBasicDescription for input
inputFormat.mSampleRate = 48000.0;
inputFormat.mFormatID = kAudioFormatLinearPCM;
inputFormat.mFormatFlags = kAudioFormatFlagIsFloat | kAudioFormatFlagsNativeEndian | kAudioFormatFlagIsPacked;
inputFormat.mChannelsPerFrame = 1;
inputFormat.mBitsPerChannel = 8 * sizeof(float);
inputFormat.mFramesPerPacket = 1;
inputFormat.mBytesPerFrame = sizeof(float) * inputFormat.mChannelsPerFrame;
inputFormat.mBytesPerPacket = inputFormat.mBytesPerFrame * inputFormat.mFramesPerPacket;
// Setup AudioStreamBasicDescription for output
outputFormat.mSampleRate = 8000.0;
outputFormat.mFormatID = kAudioFormatLinearPCM;
outputFormat.mFormatFlags = kAudioFormatFlagIsFloat | kAudioFormatFlagsNativeEndian | kAudioFormatFlagIsPacked;
outputFormat.mChannelsPerFrame = 1;
outputFormat.mBitsPerChannel = 8 * sizeof(float);
outputFormat.mFramesPerPacket = 1;
outputFormat.mBytesPerFrame = sizeof(float) * outputFormat.mChannelsPerFrame;
outputFormat.mBytesPerPacket = outputFormat.mBytesPerFrame * outputFormat.mFramesPerPacket;

// Create new instance of audio converter
AudioConverterNew(&inputFormat, &outputFormat, &converter);
// Set conversion quality
UInt32 tmp = kAudioConverterQuality_Medium;
AudioConverterSetProperty( converter, kAudioConverterCodecQuality,
                          sizeof( tmp ), &tmp );
AudioConverterSetProperty( converter, kAudioConverterSampleRateConverterQuality, sizeof( tmp ), &tmp );
// Get the size of the IO buffer(s)
UInt32 bufferSizeFrames = 0;
size = sizeof(UInt32);
AudioUnitGetProperty(self.inputUnit,
                                 kAudioDevicePropertyBufferFrameSize,
                                 kAudioUnitScope_Global,
                                 0,
                                 &bufferSizeFrames,
                                 &size);
UInt32 bufferSizeBytes = bufferSizeFrames * sizeof(Float32);
// Allocate an AudioBufferList plus enough space for array of AudioBuffers
UInt32 propsize = offsetof(AudioBufferList, mBuffers[0]) + (sizeof(AudioBuffer) * outputFormat.mChannelsPerFrame);
// Malloc buffer lists
convertedInputBuffer = (AudioBufferList *)malloc(propsize);
convertedInputBuffer->mNumberBuffers = 1;
// Pre-malloc buffers for AudioBufferLists
convertedInputBuffer->mBuffers[0].mNumberChannels = outputFormat.mChannelsPerFrame;
convertedInputBuffer->mBuffers[0].mDataByteSize = bufferSizeBytes;
convertedInputBuffer->mBuffers[0].mData = malloc(bufferSizeBytes);
memset(convertedInputBuffer->mBuffers[0].mData, 0, bufferSizeBytes);
// Setup callback for converter
static OSStatus inputProcPtr(AudioConverterRef               inAudioConverter,
                                 UInt32*                         ioNumberDataPackets,
                                 AudioBufferList*                ioData,
                                 AudioStreamPacketDescription* __nullable* __nullable  outDataPacketDescription,
                                 void* __nullable                inUserData)
{
    // Read data from buffer
}
// Perform actual sample rate conversion
AudioConverterFillComplexBuffer(converter, inputProcPtr, NULL, &numberOfFrames, convertedInputBuffer,  NULL)

输入ProcPtr回调永远不会被调用。我尝试设置不同的帧数，但仍然收到 OSStatus -50。

1）使用AudioConverterRef是进行采样率转换的正确方法，还是可以用不同的方式完成？

2）我的转换实现有什么问题？

提前谢谢大家

一个问题是：

AudioUnitGetProperty(self.inputUnit,
                             kAudioDevicePropertyBufferFrameSize,
                             kAudioUnitScope_Global,
                             0,
                             &bufferSizeFrames,
                             &size);

kAudioDevicePropertyBufferFrameSize是 OSX 属性，在 iOS 上不存在。这段代码是如何编译的？

如果您以某种方式对其进行了编译，请检查此函数的返回代码！我有一种感觉，它失败了，bufferSizeFrames是零。这将使AudioConverterFillComplexBuffer返回-50（kAudio_ParamError）。

所以在iOS上，要么自己选择一个bufferSizeFrames，要么基于AVAudioSession IOBufferDuration，如果你必须的话。

另一个问题：检查您的返回代码。全部！

例如

UInt32 tmp = kAudioConverterQuality_Medium;
AudioConverterSetProperty( converter, kAudioConverterCodecQuality,
                      sizeof( tmp ), &tmp );

我很确定在LPCM->LPCM转换中没有编解码器可言，并且在任何情况下，kAudioConverterQuality_Medium都不是与kAudioConverterCodecQuality一起使用的正确值。我不明白这个电话如何成功。

相关内容

最新更新

热门标签：