Numpy 数组形状在更改 dtype 时发生变化

为什么更改 numpy 数组元素的 dtype 会更改数组的形状？我是 numpy 的新手，我试图将 dtype 从现有的 np.int32 更改为 np.float16。这样做会更改数组的形状，但更改为 np.float32 不会修改形状。

>>> import numpy as np
>>> arr1=np.array([1,2,3,4]
>>> arr1
array([1, 2, 3, 4])
>>> arr1.shape
(4,)
>>> arr1.dtype=np.float16
>>> arr1
array([  5.96046448e-08,   0.00000000e+00,   1.19209290e-07,
     0.00000000e+00,   1.78813934e-07,   0.00000000e+00,
     2.38418579e-07,   0.00000000e+00], dtype=float16)
>>> arr1.shape
(8,)

因为更改数组的数据类型会更改实际存储的字节的含义，以及其中多少个字节构成一个值。您的初始数组可能具有数据类型int32，因此四个值中的每一个都由四个字节组成：

a = np.array([1, 2, 3, 4], dtype=np.int32)
a
>>> array([1, 2, 3, 4], dtype=int32)
bytes(a)
>>> b'x01x00x00x00x02x00x00x00x03x00x00x00x04x00x00x00'

更改

数据类型不会更改存储的字节，只会更改它们的含义：

a.dtype = np.float16
bytes(a)
>>> b'x01x00x00x00x02x00x00x00x03x00x00x00x04x00x00x00'
a
>>> array([  5.96046448e-08,   0.00000000e+00,   1.19209290e-07,
     0.00000000e+00,   1.78813934e-07,   0.00000000e+00,
     2.38418579e-07,   0.00000000e+00], dtype=float16)

要实际转换值，请使用.astype：

a.astype(np.float32)
>>> array([ 1.,  2.,  3.,  4.], dtype=float32)

你不应该使用 atrtibute dtype 来"更改"数组的 dtype。您还可以看到，与原始数字相比，新数字没有意义。

相反，您应该使用 arr1.astype(np.float16) .

我的猜测是，通过简单地更改 dtype，您只需告诉 numpy 更改它为每个元素读取的内存量。因此，由于您从 float32 减少到 float16，这是内存表示的一半，因此您可以获得两倍的大小。

如果要更改数组的数据类型，则应执行arr1.astype(np.float16) 。

我对此并不完全确定，但我猜 numpy 通过将数组的内存使用量除以数据类型的大小来计算形状。

如果您直接修改dtype，数组仍然认为其元素具有相同的大小，因此您可能会得到不同的答案。

相关内容

最新更新

热门标签：