我有一个包含30个样本的初始数据帧df
,包含以下列:
- ID:chr";ACAGA"GTCGA"GTCGA"ACAGT">
- 数值:num 1.40 2.28 0.39 1.32
- 维度:int 119 716 626 114
在此df
数据帧中,每个ID重复多次。
然后,我创建了名为df2
的第二个数据帧,只选择那些值>1.3,并将每个ID的所有尺寸相加。
df2 = df[value > 1.3, .(dim = sum(dimension)), by = ID]
新的数据帧df2
不具有来自df
的所有初始ID。特别是,我想在df2
数据帧中添加4个缺失的ID,并将它们的dim
值设置为0。
我试着使用tidyr包中的complete()
函数,但我写的代码不起作用:
complete(df2, dim, fill = list(count = 0))
你知道我应该如何使用complete((来实现我想要的结果吗?
按如下方式尝试complete
-
df2 <- tidyr::complete(df2, ID = unique(df$ID), fill = list(dim = 0))