我对R很陌生,我想帮助聚类和分析我的数据。我有一个包含许多列和数据点的数据集。数据帧看起来像这样:
V1 | V2 | |
---|---|---|
G。Cole | 53.1 | 1。 |
C。Kershaw | 56.8 | 。3 |
G。Cole | 53.5 | 。2 |
N。Ryan | 54.6 | .5 |
使用dplyr
:
library(dplyr)
df %>%
group_by(V1) %>%
summarise(std = sd(V2)) %>%
arrange(desc(std))
输出:
V1 std
<chr> <dbl>
1 G. Cole 0.283
2 C. Kershaw NA
3 N. Ryan NA
注意:除了G. Cole
之外的名称都会得到NA
,因为这是特定示例中唯一有多个示例的名称。但假设每个名字都有多个观测值,它将在更大的数据中起作用。