读取 4 通道 tif 文件时,值与 SKIMAGE、TIFFFILE 等不同



我知道opencv有一个BGR顺序,但在我的实验中,不仅顺序而且值也完全混乱

import cv2 as cv
import tifffile as tiff
import skimage.io
img_path = r"C:testpicst100r50s16_1_19.tif"
c = cv.imread(img_path,cv.IMREAD_UNCHANGED)
t = tiff.imread(img_path)
s = skimage.io.imread(img_path)
print("c:", c.shape, "t:", t.shape, "s:", s.shape)
print("c:", c.dtype, "t:", t.dtype, "s:", s.dtype)
print(c[0, 0], c[1023, 0], c[0, 1023], c[1023, 1023])
print(t[0, 0], t[1023, 0], t[0, 1023], t[1023, 1023])
print(s[0, 0], s[1023, 0], s[0, 1023], s[1023, 1023])
print(c.sum())
print(t.sum())
print(s.sum())

输出如下:

c: (1024, 1024, 4) t: (1024, 1024, 4) s: (1024, 1024, 4)
c: uint8 t: uint8 s: uint8
[ 50  63  56 182] [131 137 140 193] [29 28 27 94] [123 130 134 190]
[ 79  88  70 182] [185 181 173 193] [74 77 80 94] [180 174 165 190]
[ 79  88  70 182] [185 181 173 193] [74 77 80 94] [180 174 165 190]
# Here seems that opencv only read the alpha channel right, 
# the values of first three channels are much different than other package
539623146
659997127
659997127

我使用的图像可以在这里下载。所以,这是我的问题,如何打开 cv 处理 4 通道 tiff 文件?因为当我在 3 通道图像上进行测试时,一切看起来都很好。

我一分钟都不相信存在舍入错误或与 JPEG 解码相关的错误,如链接文章所建议的那样。

首先是因为您的图像是整数的,特别是uint8所以没有浮点数的舍入,其次是因为您的 TIF 图像的压缩不是 JPEG - 实际上没有压缩。如果您使用ImageMagick并执行以下操作,您可以自己看到这一点:

identify -verbose a.tif

或者如果您使用附带tiffinfolibtiff,如下所示:

tiffinfo -v a.tif

因此,我通过使用ImageMagick生成示例图像进行了一些实验,如下所示:

# Make 8x8 pixel TIF full of RGBA(64,128,192) with full opacity
convert -depth 8 -size 8x8 xc:"rgba(64,128,192,1)" a.tif
# Make 8x8 pixel TIFF with 4 rows per strip
convert -depth 8 -define tiff:rows-per-strip=4 -size 8x8 xc:"rgba(64,128,192,1)" a.tif

OpenCV能够正确读取所有这些,但是,当我执行以下操作时,它出错了。

# Make 8x8 pixel TIFF with RGB(64,128,192) with 50% opacity
convert -depth 8 -define tiff:rows-per-strip=1 -size 8x8 xc:"rgba(64,128,192,0.5)" a.tif

这些值在OpenCV中显示为 32、64、96 - 是的,正好是正确值的一半- 就像OpenCV预乘 alpha 一样。所以我尝试了 25% 的不透明度,结果值为正确值的 1/4。所以,我怀疑OpenCV中有一个错误,它预乘了alpha。

如果您查看您的值,您会发现tifffileskimage将第一个像素读取为:

[ 79  88  70 182 ]

如果您查看该像素的 alpha,它是 0.713725 (182/255(,如果将这些值中的每一个乘以该值,您将获得:

[ 50  63  56 182 ]

这正是OpenCV所做的。

作为一种解决方法,我想您可以除以 alpha 以正确缩放。


如果争论是OpenCV故意预乘alpha,那么这就引出了一个问题,为什么它对TIFF文件这样做而不是对PNG文件这样做:

# Create 8x8 PNG image full of rgb(64,128,192) with alpha=0.5
convert -depth 8 size 8x8 xc:"rgba(64,128,192,0.5)" a.png

检查OpenCV:

import cv2
c = cv2.imread('a.png',cv2.IMREAD_UNCHANGED)
In [4]: c.shape
Out[4]: (8, 8, 4)
In [5]: c
Out[5]: 
array([[[192, 128,  64, 128],
[192, 128,  64, 128],
...
...

如果有人认为TIF文件中的值与OpenCV报告的那样,我只能说我以50%的不透明度编写了rgb(64,128,192(,我测试了以下每个内容,发现它们都同意,唯一的例外是OpenCV正是该文件包含的内容:

  • 图像魔术 v7
  • libvips v8
  • Adobe Photoshop CC 2017
  • PIL/枕头 v5.2.0
  • GIMP v2.8
  • scikit-image v0.14

最新更新