r语言 - dplyr滤波器使用QDAP :: whate_misspelt或带有嵌套函数的dplyr滤波器



一个小数据框架:

words <- data.frame(terms = c("qhick brown fox",
          "tom dick harry", 
          "cats dgs"))

如果我使用 qdap::which_misspelled,我可以找到散布的单词:

> which_misspelled(words)
      1       8 
"qhick"   "dgs" 

,但我想做的是在包含拼写错误的行上删除df。以上返回索引1和8指我DF中提供的所有单词,无论哪一行。

如何根据包含拼写错误的单词的行来子集DF?

(如果可以使用dplyr滤波器进行奖励(

如何使用矢量化的 check_spelling,结果包含一列行号,您可以使用以下数据框架:

library(qdap)
words[check_spelling(words$terms)$row,,drop=F]
#            terms
#1 qhick brown fox
#3        cats dgs

which_misspelled功能似乎是要检查单个字符串而不是数据框架:

whate_misspelled-检查字符串的拼写。

最新更新