如何在DataFrame中组合部分重复的数据?



我正在处理来自MIMIC数据集的数据。我的一些数据是这样的:(数据类型为pandas.dataframe)

time  A  B  C D
01:00 2 NaN 3 4
02:00 2 NaN 3 4
03:00 2 NaN 3 4
01:00 NaN 4 3 4

NaN表示缺失数据。

显然第1行和第4行(它们在同一时间标记)应该合并。但是我要怎么做呢?

我需要的输出是:

time  A  B  C D
01:00 2  4  3 4
02:00 2 NaN 3 4
03:00 2 NaN 3 4

如果要对其他行求和,代码如下:

df.groupby(['time']).sum() 

df.groupby(['time']).max() 

查看更多:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html

最新更新