如何在python中为每个患者ID的时间序列数据选择最新记录,我们必须将每小时数据合并为天



下面附有数据集图像链接

在此处输入图像描述

**ID         date         ag  o   admision    discharge   a   b    c   d   e**
1   2020-01-31 01:09:00 73  1   ########    ########    0               
2020-01-31 01:25:00 73  1   ########    ########    0       136     
2020-01-31 01:44:00 73  1   ########    ########    0           103.1   
2020-01-31 01:45:00 73  1   ########    ########    0               13.9
2020-01-31 01:56:00 73  1   ########    ########    0   19.9            
2020-01-31 01:59:00 73  1   ########    ########    0               
2020-01-31 02:09:00 73  1   ########    ########    0               
2020-01-31 06:44:00 73  1   ########    ########    0               
2020-02-04 19:42:00 73  1   ########    ########    0               
2020-02-06 09:14:00 73  1   ########    ########    0       140     
2020-02-06 10:06:00 73  1   ########    ########    0           101.4   
2020-02-10 12:42:00 73  1   ########    ########    0       130     
2020-02-10 14:41:00 73  1   ########    ########    0               14.1
2020-02-10 14:47:00 73  1   ########    ########    0           98.5    
2020-02-15 09:58:00 73  1   ########    ########    0       129     
2020-02-15 10:41:00 73  1   ########    ########    0           98.1    
2020-02-15 10:50:00 73  1   ########    ########    0               
2020-02-16 08:53:00 73  1   ########    ########    0               
2020-02-16 08:55:00 73  1   ########    ########    0               
2020-02-16 09:23:00 73  1   ########    ########    0       131     
2020-02-16 10:59:00 73  1   ########    ########    0               
2020-02-16 11:32:00 73  1   ########    ########    0           100 
2020-02-16 13:33:00 73  1   ########    ########    0               12.4
2020-02-17 08:31:00 73  1   ########    ########    0               

我试过这个

tra=tra.resample('D').sum()

但它汇总了每个日期数据集中的所有行,但我需要根据 ID 为每个患者求和。

您可能希望按患者 ID 分组并执行操作。

tra=tra.groupby('PATIENT_ID').apply(lambda x: x.resample('D').sum())

让我知道这是否有效。

最新更新