我有一些灰度图像数据(0-255(。根据 NumPy dtype,我得到了不同的点积结果。例如,x0
和x1
是同一图像:
>>> x0
array([0, 0, 0, ..., 0, 0, 0], dtype=uint8)
>>> x1
array([0, 0, 0, ..., 0, 0, 0], dtype=uint8)
>>> (x0 == x1).all()
True
>>> np.dot(x0, x1)
133
>>> np.dot(x0.astype(np.float64), x1.astype(np.float64))
6750341.0
我知道第二个点积是正确的,因为因为它们是相同的图像,余弦距离应该是 0:
>>> from scipy.spatial import distance
>>> distance.cosine(x0, x1)
0.99998029729164795
>>> distance.cosine(x0.astype(np.float64), x1.astype(np.float64))
0.0
当然,点积应该适用于整数。对于小型阵列,它确实:
>>> v = np.array([1,2,3], dtype=np.uint8)
>>> v
array([1, 2, 3], dtype=uint8)
>>> np.dot(v, v)
14
>>> np.dot(v.astype(np.float64), v.astype(np.float64))
14.0
>>> distance.cosine(v, v)
0.0
发生了什么事情。为什么点积根据 dtype 给我不同的答案?
数据类型
uint8
限制为 8 位,因此它只能表示值 0, 1, ..., 255。您的点积溢出可用的值范围,因此仅保留最后 8 位。最后 8 位包含值 133。您可以验证这一点:
6750341 % (2 ** 8) == 133
# True