正则表达式 strsplit 表达式是所以它只适用于每个字符串中特定字符的第一次出现一次?

我有一个充满字符串的列表：string<- c("SPG_L_subgenual_ACC_R", "SPG_R_MTG_L_pole", "MTG_L_pole_CerebellumGM_L")

我需要拆分字符串，使它们看起来像：

"SPG_L", "subgenual_ACC_R", "SPG_R", "MTG_L_pole", "MTG_L_pole", "CerebellumGM_L"

我尝试使用以下正则表达式来拆分字符串：

str_split(string,'(?<=[[RL]|pole])_')

但这会导致：

"SPG_L", "subgenual" "ACC_R", "SPG_R", "MTG_L", "pole", "MTG_L", "pole", "CerebellumGM_L"

如何编辑正则表达式，使其在第一次出现"R"、"L"之后的"_"处拆分每个字符串元素，除非第一次出现的"R"或"L"后跟"pole"，然后在第一次出现"pole"后拆分字符串元素，并且只拆分每个字符串元素一次？

我建议使用匹配方法

^(.*?[RL](?:_pole)?)_(.*)

查看正则表达式演示

详

^- 字符串的开头
(.*?[RL](?:_pole)?)- 第 1 组：
- .*?- 除换行符字符外的任何零个或多个字符尽可能少
- [RL](?:_pole)?-R或L可选后跟_pole
_- 下划线
(.*)- 组 2：除换行符字符外的任意零个或多个字符尽可能多

请参阅 R 演示：

library(stringr)
x <- c("SPG_L_subgenual_ACC_R", "SPG_R_MTG_L_pole", "MTG_L_pole_CerebellumGM_L", "SFG_pole_R_IFG_triangularis_L", "SFG_pole_R_IFG_opercularis_L" )
res <- str_match_all(x, "^(.*?[RL](?:_pole)?)_(.*)")
lapply(res, function(x) x[-1])

输出：

[[1]]
[1] "SPG_L"           "subgenual_ACC_R"
[[2]]
[1] "SPG_R"      "MTG_L_pole"
[[3]]
[1] "MTG_L_pole"     "CerebellumGM_L"
[[4]]
[1] "SFG_pole_R"         "IFG_triangularis_L"
[[5]]
[1] "SFG_pole_R"        "IFG_opercularis_L"

split_again = function(x){
if(length(x) > 1){
return(x)
}
else{
str_split(
string = x,
pattern = '(?<=[R|L])_', 
n = 2)
}
}
str_split(
string = string,
pattern = '(?<=pole)_', 
n = 2) %>% 
lapply(split_again) %>% 
unlist()

您可以使用sub然后strsplit如下所示：

strsplit(sub("^.*?[LR](?:_pole)?\K_",":",string,perl=TRUE),":")
[[1]]
[1] "SPG_L"           "subgenual_ACC_R"
[[2]]
[1] "SPG_R"      "MTG_L_pole"
[[3]]
[1] "MTG_L_pole"     "CerebellumGM_L"

相关内容

最新更新

热门标签：

正则表达式 strsplit 表达式 是 所以它只适用于每个字符串中特定字符的第一次出现一次?

相关内容

最新更新

热门标签：

正则表达式 strsplit 表达式是所以它只适用于每个字符串中特定字符的第一次出现一次?