从音频PCM 16位到8位-获得噪音

我实现了以下算法将PCM 16位音频数据转换为8位：

if(encoding == AudioFormat.ENCODING_PCM_8BIT){
    int len = data.length;          
    data1 = new byte[len/2];
    int tempint;
    for (int k = 0, i=1; i < len; i+=2, k++) {
        tempint = ((int)data[i]) ^ 0x00000080; 
        data1[k] = (byte)tempint;
    }
    data=null;
}

其中CCD_ 1。运行完这段代码后，输出contains a lot of noise并提示我在这里做错了什么。What should I do besides dropping the lower byte?

[EDIT]：修改代码：

if(encoding == AudioFormat.ENCODING_PCM_8BIT){
            int len = data.length;          
            data1 = new byte[len/2];
            for (int i = 0; i < len/2; i++) {                   
                    data1[i] = data[i*2+1];     
            }
  }

the input/output looks like:

 Original data(counter:0) = 4
    Original data(counter:1) = -1
    Original data(counter:2) = 75
    Original data(counter:3) = -1
    Original data(counter:4) = 16
    Original data(counter:5) = -1
    Original data(counter:6) = 44
    Original data(counter:7) = -1
    Original data(counter:8) = 7
    Original data(counter:9) = -1
    Original data(counter:10) = 22
    Original data(counter:11) = -1
    Original data(counter:12) = 22
    Original data(counter:13) = -1
    Original data(counter:14) = 12
    Original data(counter:15) = -1
Output data:(counter:0) = -1
Output data:(counter:1) = -1
Output data:(counter:2) = -1
Output data:(counter:3) = -1
Output data:(counter:4) = -1
Output data:(counter:5) = -1
Output data:(counter:6) = -1
Output data:(counter:7) = -1
Output data:(counter:8) = -1
Output data:(counter:9) = -1
Output data:(counter:10) = -1
Output data:(counter:11) = -1
Output data:(counter:12) = -1
Output data:(counter:13) = -1
Output data:(counter:14) = -1
Output data:(counter:15) = -1

不管我丢弃第一个字节还是第二个字节，噪声仍然存在。这里我删除了第一个字节（而不是第二个）

以下算法大大减少了噪声量，但无法完全消除：

if(encoding == AudioFormat.ENCODING_PCM_8BIT){  
            ShortBuffer intBuf = ByteBuffer.wrap(data).order(ByteOrder.LITTLE_ENDIAN).asShortBuffer();
            short[] samples16Bit = new short[intBuf.remaining()];
            intBuf.get(samples16Bit);
            data1 = new byte[samples16Bit.length];
            for (int i = 0; i < samples16Bit.length; i++) {
                data1[i] = (byte)((samples16Bit[i] / 256)+128);
            }
        }

您所经历的噪声只是由您将音频转换为的位范围引起的。16位信号的本底噪声为-96dB，而8位信号的本底噪声为-48dB。从这些数字来看，这似乎不算多，但这是一个巨大的差异。下采样算法几乎总是采用某种抖动来减少与转换相关的噪声量。通过以编程方式或使用任何像样的音频程序在8Bit中创建正弦波，并只听结果，您可以很容易地演示质量（和噪声水平）的差异。你会发现8Bit并不是真正的质量。用16位正弦波重复实验进行比较。不是你，而是比特范围。

为什么不这么做？

int len = data.length;          
data1 = new byte[len/2];
for (int i=0; i < len/2; ++i)
    data1[i] = data[i*2];

我假设你的数据是bigendian。如果是LE，这应该有效：

int len = data.length;          
data1 = new byte[len/2];
for (int i=0; i < len/2; ++i)
    data1[i] = data[i*2+1];

由于多种原因，您有很多噪音 ~~首先，你只填充数组的其他值，没有填充的值会自动为零，这会极大地扭曲波形~~ 其次，您只是选择原始数据的前8位，这意味着您将丢失特定数据点上的所有信息。如果数据点的前8个位恰好都为零，则信息可能在较高的位中。

一个天真的建议是缩放所有数据点（如果有符号，除以2^7），使最高数据点最多为8位，您仍然会丢失信息并引入失真，因为您被迫将数据保存为整数，整数除法将迫使相同（接近）范围内的值在除法后相等，但这应该会减少噪音：）

感谢下面的评论，如果你只从原始数据中提取其他数据点，你会引入一种称为Aliasing的失真。

相关内容

最新更新

热门标签：