R中的群集数据



我对R很陌生,我想帮助聚类和分析我的数据。我有一个包含许多列和数据点的数据集。数据帧看起来像这样:

V1 V2
G。Cole 53.1 1。
C。Kershaw 56.8 。3
G。Cole 53.5 。2
N。Ryan 54.6 .5

使用dplyr:

library(dplyr)
df %>% 
group_by(V1) %>% 
summarise(std = sd(V2)) %>% 
arrange(desc(std))

输出:

V1            std
<chr>       <dbl>
1 G. Cole     0.283
2 C. Kershaw NA    
3 N. Ryan    NA   

注意:除了G. Cole之外的名称都会得到NA,因为这是特定示例中唯一有多个示例的名称。但假设每个名字都有多个观测值,它将在更大的数据中起作用。

最新更新