我有一个长格式的数据集,其中有一个标题为subject和wave的列。
每个受试者最多有两排(一排用于第1波,一排用于2波(。如果他们错过了一个波浪,那么他们只有一排。
我只想在受试者同时拥有第1波和第2波数据的情况下将其保留在数据集中。
有什么办法吗?
一种方法是删除不重复的主题。
subset(data,duplicated(variable) | duplicated(data, fromLast=TRUE))
下面是一些示例代码:
library(dplyr)
df %>%
add_count(subject) %>%
filter(n == 2)