用于检查R中日期格式的字符串模式匹配



我正在尝试使用字符串模式匹配来查找日期变量中的任何拼写错误。

所选的日期格式为dd-mm-yyyy。

我的尝试不起作用,因为它们不区分不同类型的标点符号,而且我得到的行具有所需的格式,而不是拼写错误。

谢谢!

# Data
df <- data.frame(EntryVar=c(1:7), DateVar=c("01-01-1938","1-01-1938","12-6-1939","12-06-193","12/06-1938","12.06-1938","12/06/1938"))
df$DateVar <- as.character(df$DateVar)
# Goal
dfgoal <- df[2:7, ]
# My attempts 
grep("[0-9]{2}[[:punct:]][0-9]{2}[[:punct:]][0-9]{4}", df$DateVar, value = TRUE)
df[!grep("[0-9]{2}[[:punct:]][0-9]{2}[[:punct:]][0-9]{4}",df$DateVar,value = TRUE)]

您可以尝试

df[!grepl("[0-9]{2}-[0-9]{2}-[0-9]{4}",df$DateVar),]

您可以使用invert选项来否定模式,只获取不匹配的行:

df[grep("[0-9]{2}[[:punct:]][0-9]{2}[[:punct:]][0-9]{4}",df$DateVar,invert = TRUE),]

最新更新