小贝子编程

R:删除第二列中包含值的数据帧中的重复行

本文关键字：数据帧包含值二列删除 r
更新时间 : 2023-09-19
英文 : R: Remove duplicated rows in a dataframe which contains in a second column a value

我在R中有一个data.frame()，它包含3列：

id<-c(12312, 12312, 12312, 48373, 345632, 223452)
id2<-c(1928277, 17665363, 8282922, 82827722, 1231233,12312333)
description<-c(Positive, Negative, Indetermined, Positive, Negative, Positive)

我想通过id删除重复的行，description中的值为Indetermined。

这似乎是filter()的一个问题，所以：

library(dplyr)
df %>%
mutate(count = 1) %>% # count all ids
group_by(id) %>%
mutate(count = sum(count),Duplicate = count>1) %>% # count how often each id occurs and mark duplicates
ungroup() %>%
filter(!Duplicate & description == "Indetermined") # filter out duplicates that are "indetermined"

这不是最好的方法，但这应该能奏效。

(d <- tibble(id,id2,description))
d[!d$id %in% (d$id[d$description == "Indetermined"]),]

R:删除第二列中包含值的数据帧中的重复行

相关内容

最新更新

热门标签：