R-根据键值对替换数据帧列中的所有值



在"Auto"数据集中,一列包含汽车原产地代码。1代表美国人,2代表欧洲人,3代表日本人。我想用字符串替换代码。所有1都应替换为"amer",2替换为"euro",3替换为"jap"。

查询

  1. 在R中创建键值配对的最佳方法是什么?(我用一个列表做了这个,有更好的方法吗?(

  2. 基于键值对替换数据帧列中的值的最有效方法是什么?

以下是数据模拟:

a = replicate(15, sample(1:3, 1))
a
#> 3 3 3 3 1 2 3 1 3 3 1 3 1 2 3

## Create key-value pairings
origin_code = vector(mode='list', length=3)
names(origin_code) = c(1, 2, 3)
origin_code[[1]] = 'amer'
origin_code[[2]] = 'euro'
origin_code[[3]] = 'jap'
origin_code
#> 
$`1`
[1] "amer"
$`2`
[1] "euro"
$`3`
[1] "jap"
## Replace values
<Help needed here>
# I tried the following but got NULL (Why?)
# replace values
b = for (x in unique(a)) {replace(a, a==x, origin_code[x])}
b
#> NULL

由于a是一个数值,它可以用作索引

unlist(origin_code[a], use.names = FALSE)
#[1] "jap"  "jap"  "jap"  "jap"  "amer" "euro" "jap"  "amer" "jap"  "jap"  "amer" "jap"  "amer" "euro" "jap" 

如果list和"a"的名称不是数字,则可以使用match

unlist(origin_code[match(a, names(origin_code))], use.names = FALSE)

或者也可以使用命名向量来实现这一点

unname(unlist(origin_code)[as.character(a)])

在OP的代码中,我们可以简单地更改

b <- a
for(x in unique(a))  b <- replace(b, b == x, origin_code[[x]])
b

数据

a <- c(3, 3, 3, 3, 1, 2, 3, 1, 3, 3, 1, 3, 1, 2, 3)

最新更新