如何替换r中列中字符串的第n个字符



我的输入是

a<-c("aa_bbb_cc_ddd","ee_fff_gg_hhh")
b<-c("a","b")
df<-data.frame(cbind(a,b))

我希望我的输出是

a<-c("aa_bbb-cc_ddd","ee_fff-gg_hhh")
b<-c("a","b")
df<-data.frame(cbind(a,b))

请帮

如果事情与您显示的一样一致,并且您想要替换第7个字符,那么substring可能是一个好方法,但是您通过使用data.frame而不使用stringsAsFactors = FALSE来包装列字符。您需要首先使用列字符:

df$a <- as.character(df$a)
substring(df$a, 7, 7) <- "-"
df
##               a b
## 1 aa_bbb-cc_ddd a
## 2 ee_fff-gg_hhh b

你可以使用sub,

sub("^([^_]*_[^_]*)_", "\1-",df$a)

的例子:

> a<-c("aa_bbb_cc_ddd","ee_fff_gg_hhh")
> b<-c("a","b")
> df<-data.frame(cbind(a,b))
> df
              a b
1 aa_bbb_cc_ddd a
2 ee_fff_gg_hhh b
> df$a <- sub("^([^_]*_[^_]*)_", "\1-",df$a)
> df
              a b
1 aa_bbb-cc_ddd a
2 ee_fff-gg_hhh b

下面是将n出现的_替换为-的一般方法。

n <- 2
# create regex pattern based on n
pat <- paste0("^((?:.*?_){", n - 1, "}.*?)_")
# [1] "^((?:.*?_){1}.*?)_"
# replace character
sub("^((?:.*?_){1}.*?)_", "\1-", df$a, perl = TRUE)
# [1] "aa_bbb-cc_ddd" "ee_fff-gg_hhh"

相关内容

  • 没有找到相关文章

最新更新