C语言有效地预乘图像 alpha

将一个32位图像加载到缓冲区中，然后将颜色值与相应的alpha预乘以用于混合。

以下有效，但我想知道是否有更有效的方法可以做到这一点，即使它只产生足够好的近似值？

图像数据是以下类型的指针：

typedef struct rgba_pixel
{
    uint8_t r;
    uint8_t g;
    uint8_t b;
    uint8_t a;
} rgba_pixel;
rgba_pixel * image_data;
for ( i = 0; i < length; i++ )
{
    if ( image_data[i].a == 0 )
        image_data[i].r = image_data[i].g = image_data[i].b = 0;
    else if ( image_data[i].a < 255 )
    {
        alpha_factor = image_data[i].a / 255.0;
        image_data[i].r = image_data[i].r * alpha_factor;
        image_data[i].g = image_data[i].g * alpha_factor;
        image_data[i].b = image_data[i].b * alpha_factor;
    }
}

鉴于您的a、r、g和b分量是unsigned char的，您可以通过将浮点乘法转换为整数乘法并使用shr 8（除以 256）而不是除以 255 来提高性能：

for ( i = 0; i < length; i++ )
{
    if ( image_data[i].a == 0 )
        image_data[i].r = image_data[i].g = image_data[i].b = 0;
    else if ( image_data[i].a < 255 ) 
    {
        image_data[i].r = (unsigned short)image_data[i].r * image_data[i].a >> 8;
        image_data[i].g = (unsigned short)image_data[i].g * image_data[i].a >> 8;
        image_data[i].b = (unsigned short)image_data[i].b * image_data[i].a >> 8;
    }
}

这会将 1 个 fp 除法和 3 个 fp 乘法转换为 3 个整数乘法和 3 位移位。

另一个可以做的改进是对像素数据使用联合结构：

typedef union rgba_pixel
{
    struct {
        uint8_t r;
        uint8_t g;
        uint8_t b;
        uint8_t a;
    };
    uint32_t u32;
} rgba_pixel;

然后立即将 0 分配给 r、g 和 b：

//image_data[i].r = image_data[i].g = image_data[i].b = 0; 
image_data[i].u32 = 0; //use this instead

根据x86-64 gcc 7.2 https://godbolt.org/，后者在-O3时生成的指令较少。当然，在实践中，哪个可能会更快，也可能不会更快。

要考虑的另一件事是部分循环展开，即每个循环迭代处理多个（例如 4）个像素。如果保证行的宽度是 4 的倍数，则即使不进行其他检查也可以执行此操作。

相关内容

最新更新

热门标签：

C语言 有效地预乘图像 alpha

相关内容

最新更新

热门标签：

C语言有效地预乘图像 alpha