我知道有很多包/函数,比如(janitor("tabyl"&"粘贴"来获得变量的描述性值,但我不知道如何将它们仅应用于某些列。
例如
library(pastec)
stat.desc(iris)
将返回所有变量的平均值/sd等,但我只想将其应用于数值变量。我不想子集,因为我的数据集有20多列,数字列以不同的顺序穿插。
我试过的其他东西是:
library(janitor)
lapply(iris,tabyl)
这很好,除了我不希望tabyl应用于所有列(因为具有14000个ID的列会导致难看的输出(&我的最终目标是将其放入一个外观整洁的excel文件中。
关于如何将这些很酷的函数分别应用于"数字"类型和"字符"/"因子"类型,有什么想法吗?或者指向矢量中指定的特定列?
{dplyr}包有一些选择numeric
、character
变量等的巧妙方法。
例如:
library(pastecs)
library(dplyr)
stat.desc(select_if(iris, is.numeric))
祝你好运!