r语言 - 拆分字符串并连接以删除字符串的一部分



我正在尝试删除字符串的一部分。我能想到的最好的办法是拼接然后连接(也许有更简单的方法。

list<-as.character(c("joe_joe_ID1000", "bob_bob_ID20000"))
list<-strsplit(list, "_")

我希望我的输出是"joe joe"和"bob bob",但我不清楚如何连接生成的 strsplit 列表。也许还有更简单的方法 谢谢。

使用 sapply(( 和 paste(( 你可以这样做:

sapply(list, function(x) paste(x[1:2], collapse = " "))
[1] "joe joe" "bob bob"

或者更类似于akrun的解决方案,但略有不同:

c("joe_joe_ID1000", "bob_bob_ID20000") %>% 
sub("[^_]*$", " ", .) %>%
gsub("_", " ", ., fixed = TRUE) %>%
trimws()
[1] "joe joe" "bob bob"

原始数据:

list<-as.character(c("joe_joe_ID1000", "bob_bob_ID20000"))
list<-strsplit(list, "_")

一种选择是使用sub,将单词捕获为一个组,然后使用捕获组的反向引用 (\1 \2( 以指定的方式格式化

sub("^(\w+)_(\w+)_.*", "\1 \2", list)
#[1] "joe joe" "bob bob"

注意:list是一种类型。 最好以不同的方式命名对象

数据

list <- c("joe_joe_ID1000", "bob_bob_ID20000")

您可以尝试使用stringrstr_split然后使用apply粘贴在一起。

apply(stringr::str_split(list, "_", simplify = T)[,1:2], 1, paste, collapse=" ")
[1] "joe joe" "bob bob"

或者使用tidyverse

library(tidyverse)
as.tibble(list) %>% 
separate(value,letters[1:2], sep="_", remove = F, extra = "drop") %>% 
unite(result, a,b, sep=" ")
# A tibble: 2 x 2
value           result 
<chr>           <chr>  
1 joe_joe_ID1000  joe joe
2 bob_bob_ID20000 bob bob
.Last.value %>% pull(result)
[1] "joe joe" "bob bob"

最新更新