小贝子编程

如何在DataFrame中组合部分重复的数据?

本文关键字：数据组合部 DataFrame pandas dataframe machine-learning scikit-learn deep-learning
更新时间 : 2023-09-22
英文 : How can I combine the part-duplicate data in a DataFrame?

我正在处理来自MIMIC数据集的数据。我的一些数据是这样的:(数据类型为pandas.dataframe)

time  A  B  C D
01:00 2 NaN 3 4
02:00 2 NaN 3 4
03:00 2 NaN 3 4
01:00 NaN 4 3 4

NaN表示缺失数据。

显然第1行和第4行(它们在同一时间标记)应该合并。但是我要怎么做呢?

我需要的输出是:

time  A  B  C D
01:00 2  4  3 4
02:00 2 NaN 3 4
03:00 2 NaN 3 4

如果要对其他行求和，代码如下:

df.groupby(['time']).sum()

或

df.groupby(['time']).max()

查看更多:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html

最新更新