r语言 - 使用 as.numeric(levels(f))[f] 将数据帧中的因子子集转换为数字



我有一个包含 100 个变量的数据帧,我希望其中的子集,例如 dataframename[,30:50] 转换为它们的原始数值 (1,2,3,4,5)。

我知道在转换因子时应该使用as.numeric(levels(f))[f],但是只有一次转换一个因子时,我才能做到这一点。我想一次转换它们。

这行不通:

as.numeric(levels(dataframename[,30:50]))[dataframename[,30:50]]  

这也不会:

sapply(dataframename[,30:50],as.numeric(levels(dataframename[,30:50]))    
[dataframename[,30:50]]  

有什么想法或东西我应该读吗?

这是一个较小的例子,但这个想法应该成立。 您可以使用lapply将转化应用于数据框的每一列,然后直接替换这些列。

# make example data
dat <- as.data.frame(lapply(as.data.frame(matrix(seq(2*3), ncol = 3)), factor))
factorconvert <- function(f){as.numeric(levels(f))[f]}
dat[, 2:3] <- lapply(dat[, 2:3], factorconvert)
dat
#  V1 V2 V3
#1  1  3  5
#2  2  4  6
#str(dat)
#'data.frame':  2 obs. of  3 variables:
# $ V1: Factor w/ 2 levels "1","2": 1 2
# $ V2: num  3 4
# $ V3: num  5 6

我喜欢@Dason的答案。有一种方法只能在一行中执行此操作,其中您将分解仅应用于感兴趣的列并使用匿名函数,例如:

dataframename[,30:50] <- lapply(dataframename[,30:50], function(f) as.numeric(levels(f))[f])

请注意,列不必是连续的,即您可以使用典型的 c(col1:col10, col20) 子集语法。

最新更新