行子集的一列上的熊猫标准差



我是使用Python和Pandas的新手。目前,我正在尝试创建一个从 SQL 数据库中提取数据并在 pandas 数据帧中使用该数据的报表。每一行中是服务器名称和样本日期,然后是每列的示例数据。

我已经能够使用 df[df['主机名'] == uniquehost] df 是数据帧的变量,uniquehost 是每个唯一主机名的变量。

我接下来要做的是获取其他列的 stdev,尽管我还没有能力弄清楚这部分。我尝试使用 df[df['hostname'] == uniquehost].std((

但是,这是不正确的。

谁能指出我适当的方向来解决这个问题?我怀疑我吠错了树,可能有一种非常简单的方法来处理这个问题,但我还没有遇到过。

Hostname | Sample Date | CPU Peak | Memory Peak 
server1 | 08/08/17 | 67.32 | 34.83 
server1 | 08/09/17 | 34 | 62

IIUC,您需要首先对Hostname进行df.groupby然后找到标准偏差。像这样:

In [118]: df.groupby('Hostname')[['CPU Peak', 'Memory Peak']].std()
Out[118]: 
CPU Peak  Memory Peak
Hostname                        
server1   23.560798    19.212091

最新更新