为什么我们在 Numpy 中得到这样的双布尔索引结果?



我对最后一个表达式的结果感到惊讶?

>>> from numpy import array, arange
>>> a = arange(12).reshape(3,4)
>>> b1 = array([False,True,True])             # first dim selection
>>> b2 = array([True,False,True,False])       # second dim selection
>>>
>>> a[b1,:]                                   # selecting rows
array([[ 4,  5,  6,  7],
[ 8,  9, 10, 11]])
>>>
>>> a[b1]                                     # same thing
array([[ 4,  5,  6,  7],
[ 8,  9, 10, 11]])
>>>
>>> a[:,b2]                                   # selecting columns
array([[ 0,  2],
[ 4,  6],
[ 8, 10]])
>>>
>>> a[b1,b2]                                  # a weird thing to do
array([ 4, 10])

我期望:

array([[ 4,  6],
[ 8, 10]])

你有什么解释为什么会这样吗?

让我们从你的数组开始:

a = np.array([[ 0,  1,  2,  3],
[ 4,  5,  6,  7],
[ 8,  9, 10, 11]])

您当前的索引逻辑等同于以下内容:

a[[1, 2], [0, 2]]  # array([ 4, 10])

坚持 2 维,NumPy 将其解释为索引 dim1 索引[1, 2]和 dim2 索引[0, 2],或坐标(1, 0)(2, 2)。这里不涉及广播。

要允许使用布尔数组进行广播,可以使用numpy.ix_

res = a[np.ix_(b1, b2)]
print(res)
array([[ 4,  6],
[ 8, 10]])

文档中注明了ix_执行的魔术:"布尔序列将被解释为相应维度的布尔掩码(相当于传入np.nonzero(boolean_sequence)(。

print(np.ix_(b1, b2))
(array([[1],
[2]], dtype=int64), array([[0, 2]], dtype=int64))

作为旁注,如果您有整数索引,则可以使用更直接的方法:

b1 = np.array([1, 2])
b2 = np.array([0, 2])
a[b1[:, None], b2]

另请参阅:关于为什么此方法不适用于布尔数组的相关问题。

相关内容

  • 没有找到相关文章

最新更新