删除 R 中数据中不必要的符号



那是我的数据集

1.abc
2.def
3.2354
4.. $.?,

我如何删除那些只有数字的obs,其中只有点,逗号等符号......,好吧,其中任何符号和数字(1#5??%).以及文本中少于两个字母的单词

我们可以使用str_count来计算字符数并子集数据集

library(stringr)
library(dplyr)
df1 %>%
    filter(str_count(v1, "[[:alpha:]]") > 2)

或者使用 gsub 删除任何不是字母的字符,并使用 nchar 计算字符数以创建子集的逻辑索引

subset(df1, nchar(gsub("[^[:alpha:]]+", "", v1))>2)
#    v1
#1 1.abc
#2 2.def

数据

df1 <- structure(list(v1 = c("1.abc", "2.def", "3.2354", "4.. $.?,")), 
.Names = "v1", class = "data.frame", row.names = c(NA, -4L))

最新更新