我有一个关于清洁数据/检查观察的问题。由于隐私问题,我无法共享完整的代码或数据。我可以用一个例子来说明我想要实现的目标。假设这是我的数据集。
个人 | 年度 |
---|---|
101 | 2018 |
101 | 2019 |
102 | 2019 |
103 | 2019 |
104 | 2017|
104 | 2018 |
104 | 2019 |
以下是您的示例数据:
data <- data.frame(Individual = c(101, 101, 102, 103, 104, 104, 104),
Year = c("2018", "2019", "2019", "2019", "2017", "2018", "2019"))
看起来像这样:
Individual Year
1 101 2018
2 101 2019
3 102 2019
4 103 2019
5 104 2017
6 104 2018
7 104 2019
要计算列中唯一值的数量,可以使用以下代码:
length(unique(data$Individual))
输出为:
[1] 4
在这种情况下,输出为4。