那是我的数据集
1.abc
2.def
3.2354
4.. $.?,
我如何删除那些只有数字的obs,其中只有点,逗号等符号......,好吧,其中任何符号和数字(1#5??%).以及文本中少于两个字母的单词
我们可以使用str_count
来计算字符数并子集数据集
library(stringr)
library(dplyr)
df1 %>%
filter(str_count(v1, "[[:alpha:]]") > 2)
或者使用 gsub
删除任何不是字母的字符,并使用 nchar
计算字符数以创建子集的逻辑索引
subset(df1, nchar(gsub("[^[:alpha:]]+", "", v1))>2)
# v1
#1 1.abc
#2 2.def
数据
df1 <- structure(list(v1 = c("1.abc", "2.def", "3.2354", "4.. $.?,")),
.Names = "v1", class = "data.frame", row.names = c(NA, -4L))