我从 Excel 工作表创建了一个数据帧,然后将其过滤为[Date_rank]
列中小于 10 的值。生成的数据帧filtered
然后我使用了: g = groupby("Well_name")
按每个孔隔离数据
现在我有了按Well_name
分组的数据,我如何找到该组中[RandomNumber]
的标准偏差(为我提供两个井RandomNumber
s的 stdev(?也许没有必要使用groupby
功能?
df = pd.read_csv('here.csv')
print(df)
filtered = df[df['Date_rank']<10] #filter the datafram to less than 10
print(filtered)
g = filtered.groupby('Well_name') #grouped the data to segregate by well name
这是我的数据
Well_name Date_rank RandomNumber
0 Velta 1 4
1 Velta 2 5
2 Velta 3 2
3 Velta 4 4
4 Velta 5 4
5 Velta 6 9
6 Velta 7 0
7 Velta 8 9
8 Velta 9 1
9 Velta 10 3
10 Velta 11 8
11 Velta 12 3
12 Velta 13 10
13 Velta 14 10
14 Velta 15 0
15 Ronnie 1 8
16 Ronnie 2 1
17 Ronnie 3 6
18 Ronnie 4 2
19 Ronnie 5 2
20 Ronnie 6 9
21 Ronnie 7 6
22 Ronnie 8 5
23 Ronnie 9 2
24 Ronnie 10 1
25 Ronnie 11 3
26 Ronnie 12 3
27 Ronnie 13 4
28 Ronnie 14 0
29 Ronnie 15 4
你应该能够像你所说的那样用groupby()
解决问题。您应该使用的代码如下:
g = filtered.groupby('Well_name')['RandomNumber'].std()
或使用.agg()
g = filtered.groupby('Well_name').agg({'RandomNumber':'np.std'})