熊猫将行复制为具有权重的唯一行

我正在尝试合并数据帧中的行，其中我对一个ID有不同的输入，所以我希望每个ID都有一个带权重的单行。

我的数据帧如下：

ID    A     B     C      D    weight
1    0.5    2     a      1     1.0
2    0.3    3     b      2     0.35
2    0.6    5     c      3     0.55
3    0.4    2     d      4     0.9

我需要它将ID＝2的A、B列合并为加权平均值（A为0.3*0.35+0.6*0.55，B为3*0.35+5*0.55）。对于列C，我需要选择与最高权重相关的值（对于ID=2，C=C），列d是最大值（在这种情况下，d=3），最后的权重是所有权重的总和（0.35+0.55）。基本上，我需要为重复ID的每行分配几个不同的规则，但我还没有找到如何做到这一点。

我用的是蟒蛇，我相信熊猫是最好的，但我在这里只是个初学者，所以我会听你的，并尝试你的任何建议！

非常感谢！

import pandas as pd       
a = pd.read_clipboard()
def agg_func(x):
    x.A = x.A*x.weight
    x.B = x.B*x.weight    
    return pd.Series([x.A.sum(), x.B.sum(), x.C[x.weight.idxmax()], x.D.max(), x.weight.max()], index=x.columns[1:])
print(a.groupby('ID').apply(agg_func))
        A    B  C  D  weight
ID
1   0.500  2.0  a  1    1.00
2   0.435  3.8  c  3    0.55
3   0.360  1.8  d  4    0.90

这应该做工作检查http://pandas.pydata.org/pandas-docs/stable/groupby.html了解更多。

相关内容

最新更新

热门标签：