如何根据数据框的2列合并和汇总行

  • 本文关键字:合并 2列 何根 数据 r merge
  • 更新时间 :
  • 英文 :


我把下面的数据帧设置为df1:

Date        id  Age  B   R       S
1   00/01/16    223 55  7.9  5.65   138
2   00/01/16    223 55  NA   NA      NA
3   00/01/16    223 55  NA   NA      NA
4   00/01/17    223 55  NA   NA      NA
5   00/01/17    223 55  9.6  5.71   135
6   00/01/17    223 55  NA   NA      NA
7   00/01/18    223 55  NA   NA      NA
8   00/01/18    223 55  NA   NA      NA
9   00/01/18    223 55 11.5  6.11   135
10  00/01/17    223 55  NA   NA      NA
11  00/01/05    102 60  NA   NA     135
12  00/01/05    102 60  19.7 5.5     NA
13  00/01/05    102 60  NA   NA      NA
14  00/01/05    102 60  NA   NA      NA
15  00/01/06    102 60  18.5 5.34   144
16  00/01/06    102 60  NA   NA      NA
17  00/01/06    102 60  NA   NA      NA

首先我需要基于"id"合并行然后根据"日期"合并行。我的问题不是与NA省略raw。例如,在第11号和第12号中,我必须在135和143之间选择"&;S"列。最后,我的输出应该如下面的数据帧(df2):

Date       id  Age     B     R     S
1   00/01/16    223  55     7.9   5.65  138
2   00/01/17    223  55     9.6   5.71  135
3   00/01/18    223  55     11.5  6.11  135
4   00/01/05    102  60     19.7  5.5   135
5   00/01/06    102  60     18.5  5.34  144

我写的代码如下:

df2 <- df1 %>% 
group_by(Date,id) %>% 
summarise_all(funs(na.omit))

但是我得到了下面的错误:

Error: Problem with `summarise()` column `S`.
i `S = na.omit(S)`.
x `S` must be size 6 or 1, not 0.
i An earlier column had size 6.
i The error occurred in group 1: Request_Date = "00/01/05", Patient.Code = 223

如果有人和我分享他/她的评论,我很感激。

最好的问候

将数据转换成长格式,然后返回宽格式,我认为应该做类似的事情。试试这个:

library(tidyr)
df2 = df %>% 
pivot_longer(cols = c(B, R, S)) %>% 
filter(is.na(value) == FALSE) %>% 
pivot_wider(names_from = name, values_from = value)

似乎你只删除行与NAs:

df1 |> complete.cases()

最新更新