R - 独立转换多个列

  • 本文关键字:转换 独立 r data.table
  • 更新时间 :
  • 英文 :


这可以在一行中完成吗? 该示例适用于两个变量,但我想将其用于更多变量,这使得这种方法很麻烦。

library(ggplot2)
library(data.table)
library(dplyr)
a <- dcast(mpg, year ~ cyl, fun=length, value.var = "cyl")
b <- dcast(mpg, year ~ class, fun=length, value.var = "class")
c <- inner_join(a, b, by = "year")
> c
year  4 5  6  8 2seater compact midsize minivan pickup subcompact suv
1 1999 45 0 45 27       2      25      20       6     16         19  29
2 2008 36 4 34 43       3      22      21       5     17         16  33

如果我们使用data.table,则先melt并使用dcast

library(data.table)
dcast(melt(as.data.table(mpg[c('year', 'cyl', 'class')]), 
id.var = 'year'), year ~ value)

带有[]链接的版本如下所示:

mpg = as.data.table(mpg[c('year', 'cyl', 'class')])
mpg[ , melt(.SD, id.var = 'year')
][ , dcast(.SD, year ~ value, fun.aggregate=length)]

或者使用reshape2中的recast(单行(

library(reshape2)
recast(mpg[c('year', 'cyl', 'class')], id.var = 'year', year ~ value)
#  year 2seater  4 5  6  8 compact midsize minivan pickup subcompact suv
#1 1999       2 45 0 45 27      25      20       6     16         19  29
#2 2008       3 36 4 34 43      22      21       5     17         16  33

注意:列"cyl","class"具有不同的"类型"。 但是,由于我们只是在寻找length所以没关系

我使用table找到了一个相当简单但非常灵活的解决方案:

(do.call(cbind, lapply(list("cyl", "class"), function(x) {
table(mpg[, c("year", x)])
})))
4 5  6  8 2seater compact midsize minivan pickup subcompact suv
1999 45 0 45 27       2      25      20       6     16         19  29
2008 36 4 34 43       3      22      21       5     17         16  33

对于更多变量,只需将它们添加到列表中即可。

(do.call(cbind, lapply(list("cyl", "class", "drv"), function(x) {
table(mpg[, c("year", x)])
})))
4 5  6  8 2seater compact midsize minivan pickup subcompact suv  4  f  r
1999 45 0 45 27       2      25      20       6     16         19  29 49 57 11
2008 36 4 34 43       3      22      21       5     17         16  33 54 49 14

最新更新