Regex在PySpark删除一行与特定的工作在字符串的任何地方



我试图在列行字符串的任何地方过滤出具有特定单词的行。具体来说,我想删除字符串中包含单词final的所有行。

到目前为止我有以下内容:

df.filter(col("COLUMN").rlike("(?i)^*final$"))

但是它只在单词final位于字符串开头时删除rwos。如何组合一个pyspark兼容的正则表达式来查找字符串中的任何地方的单词?开头、中间或结尾

如果你想要一个正则表达式的解决方案,那么下面应该工作

df.filter(F.col("COLUMN").rlike("^((?!final).)*$")).show()

最新更新