根据另一个r检查一列的值

假设我有一个数据框架

Name <- c("Jon", "Jon", "Maria", "Maria", "Tina", "Tina")
Score <- c(23, 23, 32, 32, 26, 78)
df <- data.frame(Name, Score)

我想看看Score列的每个名称是否相同或不同。理论上，我希望每个名字的每列的分数是相同的，但也有可能是不同的(比如Tina)，我想检查一下。

做这件事的有效方法是什么?(我的数据框有超过150000行)。

尝试获取计数，然后您可以检查Name是否重复

library(magrittr)
library(dplyr)
df %>%
count(Name, Score)%>%
add_count(Name, name = "name_n")%>%
filter(name_n > 1)
#output
Name Score n name_n
1 Tina    26 1      2
2 Tina    78 1      2

这有帮助吗?

> df %>% count(Name, Score) %>% filter(n<2)
Name Score n
1 Tina    26 1
2 Tina    78 1

相关内容

最新更新

热门标签：