为什么DCT变换在视频/图像压缩中优于其他变换



我介绍了DCT(离散余弦变换)在图像和视频压缩标准中的应用。

但是为什么DCT比dft或dst等其他变换更受欢迎呢?

由于cos(0)为1,因此DCT-II的第1(0)系数为被变换值的平均值。这使得每个8x8块的第一个系数表示其组成像素的平均色调,这显然是一个良好的开端。随后的系数增加了越来越多的细节水平,从扫描梯度开始,继续到越来越精细的模式,而它恰好是前几个系数捕获了摄影图像中的大部分信号。

Sin(0)为0,说明DSTs开始时的偏移量为0.5或1,第一个系数是一个平缓的丘而不是平坦的平原。这不太可能适用于普通图像,结果是dst比dct需要更多的系数来编码大多数块。

DCT刚好适合。

在执行图像压缩时,我们最好的选择是执行KLT或 karhunen - lo变换,因为它可以使原始图像和压缩图像之间的均方误差最小。然而,KLT依赖于输入图像,这使得压缩过程不切实际。

DCT是最接近KL变换的。大多数情况下,我们对低频信号感兴趣,因此只需要偶数分量,因此只计算DCT在计算上是可行的。

同样,使用余弦函数而不是正弦函数对于压缩是至关重要的,因为需要更少的余弦函数来近似一个典型的信号(参见Douglas Bagnall的回答进一步解释)。

使用余弦的另一个优点是没有不连续。在DFT中,由于信号是周期性表示的,当截断表示系数时,信号将倾向于"失去其形式"。而在DCT中,由于连续的周期结构,信号可以承受相对较多的系数截断,但仍能保持期望的形状。

图像宏块的上下边缘和/或左右边缘不匹配的DCT在高频率系数下的能量比DFT要少。因此,允许更多的机会来删除这些高系数,更粗略地量化或压缩,而不创建更多可见的宏块边界工件。

DCT优于DFT(离散傅里叶变换)和KLT (Karhunen-Loeve变换)

1. Fast algorithm
2. Good energy compaction
3. Only real coefficients

最新更新