Numpy:提取子数组的有效方法



我有一个大的二维numpy数组A,维度围绕250000 x 30和两个一维numpy数组xy。我想提取在x行和y列A的子数组。哪种方法更有效?

  1. A[x[:,np.newaxis], y]
  2. A[np.ix_(x,y)]

基准测试!

import numpy as np
# some data
A = np.random.random((250000, 30))
# some random indices
x = np.random.randint(0, 250000, 150000)
y = np.random.randint(0, 30, 10)
def method1(A, x, y):
    return A[x[:, np.newaxis], y]
def method2(A, x, y):
    return A[np.ix_(x,y)]
def method3(A, x, y):
    return A[x][:,y]
def method4(A, x, y):
    return A[:,y][x]

这三个方法给出了以下基准:

method1: 87.7 ms
method2: 89.2 ms
method3: 115 ms
method4: 141 ms

因此,答案是问题中的两种方法之间没有真正的区别。

最新更新