我在"file.csv"等文件中有数据。我想用 np.genfromtxt 阅读它们,并在某些列上做一些统计数据,如平均值、方差等(X, Y, Z)
。但是我想对X > 1, Y > 3 Z > 2
等进行统计。这是一个简单的例子。
这段代码产生几乎正确的结果,但它包括所有 X、Y 和 Z,我想做同样的事情,但使用我上面指定的 X,Y,Z 条件。
#file.csv
X,Y,Z
1,2,3
4,2,5
15,9,1
#
data = np.genfromtxt(file.csv, delimiter=',', dtype=float, unpack=True, skiprows = 0)
X=data[0];Y=data[1];Z=data[2]
Mean = np.average(X)
--> 做得很好,得到平均值。但是,我希望我只得到平均值 X> 1(例如)...我该如何做到这一点?
为了仅对某些字段求平均值,您将平均值分解如下:
- 查找满足特定元素的索引 (ind)标准
- 查找仅使用 ind 中的值编制索引的数组的平均值
以下代码正是这样做的:
indexes = np.where(X>1)[0] # We index with '0' here to get to the 1st element of the returned tuple
Mean = np.mean(X[indexes])
您可以使用所谓的"花式索引",X[X>1]
,来选择所需的数组部分:
import numpy as np
X,Y,Z = np.genfromtxt('file.csv', delimiter=',', dtype=float, unpack=True, skiprows = 0)
print(X)
# [ nan 1. 4. 15.]
print(X[X>1])
# [ 4. 15.]
print(np.average(X[X>1]))
# 9.5
要将两个掩码(布尔数组)与按位逻辑 and 组合在一起,请使用 &
运算符:
print(np.average(X[(X>1)&(X<10)]))
# 4.0