从 ndarray Python 2.7 中删除列和行



我已经实现并算法从 Python 2.7 中的 ndarray 中删除了一些列和行,但我觉得应该有更好的方法可以做到这一点。可能我不知道如何在 Python 中做好它,这就是我把问题放在这里的原因。我一直在搜索,但我没有成功找到类似的问题和文档中(例如在 scipy 的切片和索引文档中)

假设我有一个包含一些行和列的 ndarray:

number_of_rows = 3
number_of_columns = 3
a = np.arange(number_of_rows*number_of_columns).reshape(number_of_rows,number_of_columns)
a

哪个输出是:

array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])

假设我想删除上一个 ndarray 的一些列和/或行。特别是我想删除第 0 列和第 1 行,这是一个输出,如下所示:

array([[1, 2],
[7, 8]])

为此,我遵循以下步骤,但是它们看起来不是很优雅,我觉得它们应该是一个更好的实现。

  1. 我选择要删除的列和行,在此示例中:

    rows_to_remove = [1]
    columns_to_remove = [0]
    
  2. 现在,我创建了几个列表,其中包含要保留的列和行。

    rows_to_keep = list(set(range(0,a.shape[0]))-set(rows_to_remove))
    columns_to_keep = list(set(range(0,a.shape[1]))-set(columns_to_remove))
    

    Matlab 中的这一步将更简单,只需使用 ~ 对矩阵的索引进行切片(在 python ndarray 中)。有没有更好的方法可以做到这一点?

  3. 然后我选择要保留的列和行:

    a[rows_to_keep,:][:,columns_to_keep]
    

输出:

array([[1, 2],
[7, 8]])

请注意,如果您只是写:

a[rows_to_keep,columns_to_keep]

其输出为:

array([1, 8])

这对我来说有点令人沮丧,a[rows_to_keep,columns_to_keep]a[rows_to_keep,:][:,columns_to_keep]不同.有没有更好的方法来涵盖这些步骤?

谢谢

您可以使用 delete 方法完成此操作: 以问题中的数组为例。它会是这样的:

number_of_rows = 3
number_of_columns = 3
a=np.arange(number_of_rows*number_of_columns).reshape(number_of_rows,number_of_columns)
b=np.delete(a,1,0)
b=np.delete(b,0,1)

瞧,b 包含输出数组,你想要!!

对于问题 2)

而不是:

a[rows_to_keep,:][:,columns_to_keep]

用:

a[np.ix_(rows_to_keep,columns_to_keep)].

这称为高级索引(参见 [Numpy 文档1 和 以最 pythonian 的方式在 ndarray 的子数组中写入)。蟒蛇 2 )

对于问题 1)我将使用问题 2 以前的解决方案: a) 创建掩码,有更优雅的方法可以做到这一点,例如,请参阅从数组创建布尔掩码,但为了简单起见:

mask = np.zeros(a.shape,dtype=bool)
mask[rows_to_remove,:] = True
mask[:,columns_to_remove] = True 

现在,您可以可视化:

a[~np.array(mask)] 

请注意,现在不需要问题 2) 答案。

总结

mask = np.zeros(a.shape,dtype=bool)
mask[rows_to_remove,:] = True
mask[:,columns_to_remove] = True 
a[~np.array(mask)] 

如果需要,您可以重塑:

a[~np.array(mask)].reshape(a.shape[0]-len(rows_to_remove),a.shape[1]-len(columns_to_remove))

最新更新