numpy在小数组范围内找到最大值的索引

我具有表单的二维数组

 data = array([
       [  0.23        ,   0.61070541],
       [  1.12        ,   0.94622007],
       [  2.33        ,   0.20868555],
       [  3.23        ,   0.26452314],
       [  4.67        ,   0.93988767],
       [  5.17        ,   0.05736691],
       [  6.74        ,   0.54063927],
       [  7.58        ,   0.3045981 ],
       [  8.48        ,   0.13873822],
       [  9.47        ,   0.27759926],
       [ 10.12        ,   0.27030156]])

，我想在第二列中找到最大值，以限制为第一列给出的间隔。我想查看第5至8行，并在第二列中找到最大值的最大行索引。在将第6行的给定数据集中，数据[6] = 6。，0.54063927。我的目标是使用numpy获得索引6。到目前为止，我会做

data_interval = data[ np.where( (data[:,0] > 5) & data[:,0] < 9 ) ]
max_interval = data_interval.max(axis = 0)[1]
index = np.where(data == [None, max_interval])[0]

如果最大值在间隔之外的数据中没有另一个时间出现，则可以使用。否则我会进入最后一个NP。在哪里呼叫多个索引。总体而言，这感觉很笨拙，我想知道是否有更快的方式仅在间隔中产生索引。我想要关于总数据数组的绝对索引，而不是data_interval数组的索引。通常，我发现在numpy中，一旦数据在数组中在一起，就很难在numpy中进行分类/搜索数据。欢迎提示/有关处理此类问题的建议。

我们可以通过第一个屏蔽条件 not> not 保留的值来做到这一点，然后使用argmax来计算索引第二列是最大的。

所以我们掩盖了：

data_masked = np.ma.masked_where((data[:,0] < 5) | (data[:,0] > 9), data[:,1])

因此，这里的条件是过滤条件的对面：将data[:0] < 5或data[:0] > 9掩盖的所有行。请注意，我们已经对第二列进行了投影。中间结果是：

>>> np.ma.masked_where((data[:,0] < 5) | (data[:,0] > 9), data[:,1])
masked_array(data=[--, --, --, --, --, 0.05736691, 0.54063927, 0.3045981,
                   0.13873822, --, --],
             mask=[ True,  True,  True,  True,  True, False, False, False,
                   False,  True,  True],
       fill_value=1e+20)

然后我们用：

计算索引

index = np.argmax(b)

相关内容

最新更新

热门标签：