当我使用以下代码时:
print(self.df.groupby(by=[2])[3].agg(['sum']))
在以下数据帧上:
0 1 2 3 4 5 6 7
0 15 LCU Test 1 308.02 170703 ALCU 4868 MS10
1 16 LCU Test 2 127.37 170703 ALCU 4868 MS10
sum 函数未正确完成,因为值列 (col 3( 返回值 (308.02127.37( 的串联字符串,而不是维护各个值的完整性以允许操作。
似乎您的第三列是一个字符串。您是否使用dtype=str
加载了数据帧?
此外,尽量不要对列进行硬编码。您可以使用.astype
或pd.to_numeric
进行转换,然后应用sum
:
self.df.groupby(self.df.columns[2])[self.df.columns[3]].agg(
lambda x: pd.to_numeric(x, errors='coerce').sum()
)
或
self.df.groupby(self.df.columns[2])[self.df.columns[3]].agg(
lambda x: x.astype(float).sum()
)