生成R中不同变量类型的描述性统计信息



我知道有很多包/函数,比如(janitor("tabyl"&"粘贴"来获得变量的描述性值,但我不知道如何将它们仅应用于某些列。

例如

library(pastec)
stat.desc(iris) 

将返回所有变量的平均值/sd等,但我只想将其应用于数值变量。我不想子集,因为我的数据集有20多列,数字列以不同的顺序穿插。

我试过的其他东西是:

library(janitor) 
lapply(iris,tabyl)

这很好,除了我不希望tabyl应用于所有列(因为具有14000个ID的列会导致难看的输出(&我的最终目标是将其放入一个外观整洁的excel文件中。

关于如何将这些很酷的函数分别应用于"数字"类型和"字符"/"因子"类型,有什么想法吗?或者指向矢量中指定的特定列?

{dplyr}包有一些选择numericcharacter变量等的巧妙方法。

例如:

library(pastecs)
library(dplyr)
stat.desc(select_if(iris, is.numeric))

祝你好运!

最新更新