从音频PCM 16位到8位-获得噪音



我实现了以下算法将PCM 16位音频数据转换为8位:

if(encoding == AudioFormat.ENCODING_PCM_8BIT){
    int len = data.length;          
    data1 = new byte[len/2];
    int tempint;
    for (int k = 0, i=1; i < len; i+=2, k++) {
        tempint = ((int)data[i]) ^ 0x00000080; 
        data1[k] = (byte)tempint;
    }
    data=null;
}

其中CCD_ 1。运行完这段代码后,输出contains a lot of noise并提示我在这里做错了什么。What should I do besides dropping the lower byte?

[EDIT]:修改代码:

if(encoding == AudioFormat.ENCODING_PCM_8BIT){
            int len = data.length;          
            data1 = new byte[len/2];
            for (int i = 0; i < len/2; i++) {                   
                    data1[i] = data[i*2+1];     
            }
  }

the input/output looks like:

 Original data(counter:0) = 4
    Original data(counter:1) = -1
    Original data(counter:2) = 75
    Original data(counter:3) = -1
    Original data(counter:4) = 16
    Original data(counter:5) = -1
    Original data(counter:6) = 44
    Original data(counter:7) = -1
    Original data(counter:8) = 7
    Original data(counter:9) = -1
    Original data(counter:10) = 22
    Original data(counter:11) = -1
    Original data(counter:12) = 22
    Original data(counter:13) = -1
    Original data(counter:14) = 12
    Original data(counter:15) = -1
Output data:(counter:0) = -1
Output data:(counter:1) = -1
Output data:(counter:2) = -1
Output data:(counter:3) = -1
Output data:(counter:4) = -1
Output data:(counter:5) = -1
Output data:(counter:6) = -1
Output data:(counter:7) = -1
Output data:(counter:8) = -1
Output data:(counter:9) = -1
Output data:(counter:10) = -1
Output data:(counter:11) = -1
Output data:(counter:12) = -1
Output data:(counter:13) = -1
Output data:(counter:14) = -1
Output data:(counter:15) = -1

不管我丢弃第一个字节还是第二个字节,噪声仍然存在。这里我删除了第一个字节(而不是第二个)

以下算法大大减少了噪声量,但无法完全消除:

if(encoding == AudioFormat.ENCODING_PCM_8BIT){  
            ShortBuffer intBuf = ByteBuffer.wrap(data).order(ByteOrder.LITTLE_ENDIAN).asShortBuffer();
            short[] samples16Bit = new short[intBuf.remaining()];
            intBuf.get(samples16Bit);
            data1 = new byte[samples16Bit.length];
            for (int i = 0; i < samples16Bit.length; i++) {
                data1[i] = (byte)((samples16Bit[i] / 256)+128);
            }
        }

您所经历的噪声只是由您将音频转换为的位范围引起的。16位信号的本底噪声为-96dB,而8位信号的本底噪声为-48dB。从这些数字来看,这似乎不算多,但这是一个巨大的差异。下采样算法几乎总是采用某种抖动来减少与转换相关的噪声量。通过以编程方式或使用任何像样的音频程序在8Bit中创建正弦波,并只听结果,您可以很容易地演示质量(和噪声水平)的差异。你会发现8Bit并不是真正的质量。用16位正弦波重复实验进行比较。不是你,而是比特范围。

为什么不这么做?

int len = data.length;          
data1 = new byte[len/2];
for (int i=0; i < len/2; ++i)
    data1[i] = data[i*2];

我假设你的数据是bigendian。如果是LE,这应该有效:

int len = data.length;          
data1 = new byte[len/2];
for (int i=0; i < len/2; ++i)
    data1[i] = data[i*2+1];

由于多种原因,您有很多噪音 首先,你只填充数组的其他值,没有填充的值会自动为零,这会极大地扭曲波形 其次,您只是选择原始数据的前8位,这意味着您将丢失特定数据点上的所有信息。如果数据点的前8个位恰好都为零,则信息可能在较高的位中。

一个天真的建议是缩放所有数据点(如果有符号,除以2^7),使最高数据点最多为8位,您仍然会丢失信息并引入失真,因为您被迫将数据保存为整数,整数除法将迫使相同(接近)范围内的值在除法后相等,但这应该会减少噪音:)

感谢下面的评论,如果你只从原始数据中提取其他数据点,你会引入一种称为Aliasing的失真。

最新更新