使用 2D 阵列广播一维阵列

我有一个包含 ~10**8 个元素的一维数组array_data。

我有第二个数组array_index它指定用于切片array_data的绑定索引。

以下是最小、完整和可验证的array_data和array_index示例：

import numpy as np
#Create data
array_data = np.arange(100)
#Randomly create indices
array_index = np.sort(np.random.randint(100, size=(10,2)))
#For each randomly created index, slice the array
array_sliced = [array_data[index[0]:index[1]]) for index in array_index]
#Now data is sliced, perform operation on the sliced data. For example:
val = []
for slice in array_sliced:
val.append(np.nanmean(slice))

问题：使用array_indexaxis=1对array_data进行切片的最佳方法是什么，以便我可以在切片数组上执行其他任务(例如min、max、mean(？

我目前的解决方案使用列表理解并转换回 numpy 数组。这种方法看起来笨拙而缓慢：

>>> np.array([np.nanmean(array_data[index[0]:index[1]]) for index in array_index], dtype=np.float64)

编辑：添加了最小，完整和可验证的示例(适用于python 2.7(。

当我运行你的代码时，我得到一个不同大小的数组列表：

In [63]: [len(x) for x in array_sliced]
Out[63]: [3, 46, 38, 9, 73, 66, 3, 23, 40, 36]

(你也从np.diff(array_index,axis=1)得到这个(

一般的观察是，在处理不同大小的数组时，很难以任何 2D 方式处理它们。

您也许能够生成 (10,100( 掩码，True 表示要在每行中保留的值，False 表示省略。或者也许np.nan省略。

或者考虑填充这 10 个数组，以便它们适合 (10,73( 数组，再次使用适当的填充元素(0、nan 等(。

相关内容

最新更新

热门标签：