我有一个带有字符列的数据框架:
df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
df
# var1
# 1 aabbcdefg
# 2 aabbcdefg
我想替换几个不同的单独字符,例如from "a"To "h" from ","我等等......目前我使用几个呼叫gsub
:
df$var1 <- gsub("a", "h", df$var1)
df$var1 <- gsub("b", "i", df$var1)
df$var1 <- gsub("c", "j", df$var1)
df$var1 <- gsub("d", "k", df$var1)
df$var1 <- gsub("e", "l", df$var1)
df$var1 <- gsub("f", "m", df$var1)
df
# var1
# 1 hhiijklmg
# 2 hhiijklmg
然而,我相信有更优雅的解决方案。有什么好主意吗?
您想要chartr
:
df$var1 <- chartr("abcdef", "hijklm", df$var1)
df
# var1
# 1 hhiijklmg
# 2 hhiijklmg
可以创建from
和to
矢量:
from <- c('a','b','c','d','e','f')
to <- c('h','i','j','k','l','m')
,然后向量化gsub
函数:
gsub2 <- function(pattern, replacement, x, ...) {
for(i in 1:length(pattern))
x <- gsub(pattern[i], replacement[i], x, ...)
x
}
给了:
> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df$var1 <- gsub2(from, to, df$var1)
> df
var1
1 hhiijklmg
2 hhiijklmg
如果您不想使用chartr,因为替换可能不止一个字符,那么另一个选择是使用gsubfn包中的gsubfn(我知道这不是gsub,而是对gsub的扩展)。下面是一个例子:
> library(gsubfn)
> tmp <- list(a='apple',b='banana',c='cherry')
> gsubfn('.', tmp, 'a.b.c.d')
[1] "apple.banana.cherry.d"
替换也可以是一个函数,它将接受匹配并返回该匹配的替换值。