我有一个包含 100 个变量的数据帧,我希望其中的子集,例如 dataframename[,30:50] 转换为它们的原始数值 (1,2,3,4,5)。
我知道在转换因子时应该使用as.numeric(levels(f))[f]
,但是只有一次转换一个因子时,我才能做到这一点。我想一次转换它们。
这行不通:
as.numeric(levels(dataframename[,30:50]))[dataframename[,30:50]]
这也不会:
sapply(dataframename[,30:50],as.numeric(levels(dataframename[,30:50]))
[dataframename[,30:50]]
有什么想法或东西我应该读吗?
这是一个较小的例子,但这个想法应该成立。 您可以使用lapply
将转化应用于数据框的每一列,然后直接替换这些列。
# make example data
dat <- as.data.frame(lapply(as.data.frame(matrix(seq(2*3), ncol = 3)), factor))
factorconvert <- function(f){as.numeric(levels(f))[f]}
dat[, 2:3] <- lapply(dat[, 2:3], factorconvert)
dat
# V1 V2 V3
#1 1 3 5
#2 2 4 6
#str(dat)
#'data.frame': 2 obs. of 3 variables:
# $ V1: Factor w/ 2 levels "1","2": 1 2
# $ V2: num 3 4
# $ V3: num 5 6
我喜欢@Dason
的答案。有一种方法只能在一行中执行此操作,其中您将分解仅应用于感兴趣的列并使用匿名函数,例如:
dataframename[,30:50] <- lapply(dataframename[,30:50], function(f) as.numeric(levels(f))[f])
请注意,列不必是连续的,即您可以使用典型的 c(col1:col10, col20) 子集语法。