如何查找筛选数据的标准偏差(分组依据)



我从 Excel 工作表创建了一个数据帧,然后将其过滤为[Date_rank]列中小于 10 的值。生成的数据帧filtered

然后我使用了: g = groupby("Well_name") 按每个孔隔离数据

现在我有了按Well_name分组的数据,我如何找到该组中[RandomNumber]的标准偏差(为我提供两个井RandomNumber s的 stdev(?也许没有必要使用groupby功能?

df = pd.read_csv('here.csv')
print(df)
filtered = df[df['Date_rank']<10] #filter the datafram to less than 10
print(filtered)
g = filtered.groupby('Well_name') #grouped the data to segregate by well name

这是我的数据

     Well_name  Date_rank  RandomNumber
0      Velta          1             4
1      Velta          2             5
2      Velta          3             2
3      Velta          4             4
4      Velta          5             4
5      Velta          6             9
6      Velta          7             0
7      Velta          8             9
8      Velta          9             1
9      Velta         10             3
10     Velta         11             8
11     Velta         12             3
12     Velta         13            10
13     Velta         14            10
14     Velta         15             0
15    Ronnie          1             8
16    Ronnie          2             1
17    Ronnie          3             6
18    Ronnie          4             2
19    Ronnie          5             2
20    Ronnie          6             9
21    Ronnie          7             6
22    Ronnie          8             5
23    Ronnie          9             2
24    Ronnie         10             1
25    Ronnie         11             3
26    Ronnie         12             3
27    Ronnie         13             4
28    Ronnie         14             0
29    Ronnie         15             4

你应该能够像你所说的那样用groupby()解决问题。您应该使用的代码如下:

g = filtered.groupby('Well_name')['RandomNumber'].std()

或使用.agg()

g = filtered.groupby('Well_name').agg({'RandomNumber':'np.std'})

相关内容

  • 没有找到相关文章

最新更新