小贝子编程

Python Numpy优化计算了一个数组在其他数组给定的索引上的平均值

本文关键字：数组其他索引平均值一个计算优化 Numpy 算了 Python python numpy
更新时间 : 2023-09-19
英文 : Python Numpy optimized calculate mean of an array on indices given by other array

如何使用另一个数组的x索引计算numpy数组y的平均值？

import numpy
x = numpy.array([100, 100, 20000, 20000, 100, 13, 100, numpy.nan])
y = numpy.array([10, 20, 30, 40, numpy.nan, 50, 60, 70])

预期结果：

result['13']: (50)/1
result['100']: (10+20+60)/3
result['20000']: (30+40)/2

以下代码有效，但由于我的真实数据集的大小而效率低下：

result = {}
unique = numpy.unique(x[~numpy.isnan(x)]).astype(int)
for elem in unique:
pos = numpy.where(x == elem)
avg = numpy.nanmean(y[pos])
result[elem]=avg
print(result)

我读过numpy.bincount，但无法使用它。

以下是如何使用bincount：

>>> nn=~(np.isnan(x)|np.isnan(y))
>>> xr,yr = x[nn],y[nn]
>>> unq,idx,cnt=np.unique(xr,return_inverse=True,return_counts=True)
>>> dict(zip(unq,np.bincount(idx,yr)/cnt))
{13.0: 50.0, 100.0: 30.0, 20000.0: 35.0}

Python Numpy优化计算了一个数组在其他数组给定的索引上的平均值

相关内容

最新更新

热门标签：