我正在处理来自MIMIC数据集的数据。我的一些数据是这样的:(数据类型为pandas.dataframe)
time A B C D
01:00 2 NaN 3 4
02:00 2 NaN 3 4
03:00 2 NaN 3 4
01:00 NaN 4 3 4
NaN
表示缺失数据。
显然第1行和第4行(它们在同一时间标记)应该合并。但是我要怎么做呢?
我需要的输出是:
time A B C D
01:00 2 4 3 4
02:00 2 NaN 3 4
03:00 2 NaN 3 4
如果要对其他行求和,代码如下:
df.groupby(['time']).sum()
或
df.groupby(['time']).max()
查看更多:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html