numpy数组dtype在windows10 64位机器中默认为int32

我在笔记本电脑上安装了Anaconda 3 64位，并在Spyder中编写了以下代码：

import numpy.distutils.system_info as sysinfo
import numpy as np
import platform
sysinfo.platform_bits 
platform.architecture()
my_array = np.array([0,1,2,3])
my_array.dtype

这些命令的输出显示如下：

sysinfo.platform_bits 
Out[31]: 64
platform.architecture()
Out[32]: ('64bit', 'WindowsPE')
my_array = np.array([0,1,2,3])
my_array.dtype
Out[33]: dtype('int32')

我的问题是，即使我的系统是64位的，为什么默认情况下数组类型是int32而不是int64？

感谢您的帮助。

默认整数类型np.int_为C长：

http://docs.scipy.org/doc/numpy-1.10.1/user/basics.types.html

但是C long在win64中是int32。

https://msdn.microsoft.com/en-us/library/9c3yd98k.aspx

这有点奇怪的win64平台。

在Microsoft C中，即使在64位系统上，long int数据类型的大小也是32位。（例如，https://msdn.microsoft.com/en-us/library/9c3yd98k.aspx.)Numpy从C编译器的long int继承整数的默认大小。

原始海报Prana问了一个非常好的问题。"为什么在64位机器上，整数默认设置为32位？"

据我所知，简短的回答是："因为它设计错了"。看起来很明显，64位机器应该在任何相关的解释器中默认将整数定义为64位。当然，这两个答案解释了为什么情况并非如此。现在情况不一样了，所以我提供这个更新。

我注意到，对于CentOS-7.4 Linux和MacOS 10.10.5（新的和旧的），运行Python 2.7.14（Numpy 1.14.0）（截至2018年1月），默认整数现在定义为64位。（初始示例中的"my_array.dtype"现在将在两个平台上报告"dtype（'t64'）"。

如果你在做整数运算，在任何解释器中使用32位整数作为默认整数都会产生非常奇怪的结果，正如这个问题所指出的：

使用numpy对平方值得出负数

现在看来，Python和Numpy已经更新和修订（有人可能会说已经更正），因此为了复制上面问题中所述的问题，您必须将Numpy数组明确定义为int32。

在Python中，现在在这两个平台上，默认整数看起来都是int64。此代码在两个平台（CentOS-7.4和MacOSX 10.10.5）上运行相同：

>>> import numpy as np
>>> tlist = [1, 2, 47852]
>>> t_array = np.asarray(tlist)
>>> t_array.dtype

dtype('int64')

>>> print t_array ** 2

[ 1 4 2289813904]

但是，如果我们将t_array设为32位整数，则会得到以下结果，因为整数计算会覆盖32位字中的符号位。

>>> t_array32 = np.asarray(tlist, dtype=np.int32)
>>> t_array32.dtype

dtype*('int32')

>>> print t_array32 ** 2

[ 1 4 -2005153392]

使用int32的原因当然是为了效率。在某些情况下（例如使用TensorFlow或其他神经网络机器学习工具），您希望使用32位表示（当然主要是浮点），因为与使用64位浮点相比，速度增益可能非常显著。

您可以创建数据类型设置为int64的数组。例如，

#Windows uses int32 by default, but if we want int64, we can tell it to
x = np.array([1, 2, 3, 4, 5], dtype=np.int64)

您可以显式地将数组强制转换为所需的数据类型，如下所示：

int64_array = int32_array.astype(np.int64)

相关内容

最新更新

热门标签：