所以我一直在努力找到解决这个问题的方法。我有 2 根字符串。例如:
可饮用酸奶对您的健康有益
和
喝瑜伽是好的,如果你不超过
所以我想要的是补充不完整的单词,并包括不在两个字符串中的单词。术语的顺序并不重要,大小写也不重要。 所以我的结果可能是:
饮用酸奶对你的健康有益,如果不超过
我只是想补充字符串。知道吗?谢谢。
foo <- "Drinkable Yoghurt Is Good for your health"
bar <- "Drink Yog is good if you do not exceed"
foo_vec <- unlist(strsplit(foo, " "))
bar_vec <- unlist(strsplit(bar, " "))
在foo
中找到不包含在bar
单词中的单词,反之亦然,忽略大小写。
foo_vec2 <- foo_vec[!apply(sapply(foo_vec, function(x) grepl(x, bar_vec, ignore.case = TRUE)), 2, any)]
bar_vec2 <- bar_vec[!apply(sapply(bar_vec, function(x) grepl(x, foo_vec, ignore.case = TRUE)), 2, any)]
在两者中找到单词,忽略大小写。
both <- intersect(tolower(foo_vec), tolower(bar_vec))
把所有东西放在一起。
paste(c(both, foo_vec2, bar_vec2), collapse=" ")
#> [1] "is good Drinkable Yoghurt for your health if do not exceed"