在数据帧上写scala过滤器,一列应该有两个以上的单词



val tempDf=Df。filter(Df("column_1"(==;200〃(

现在想要基于应该具有2个以上单词的一列(column_2(来过滤tempDf。

val extractedDf=温度Df过滤器(*(

我们如何在*处用scala编写过滤器。

您可以使用sizesplit函数。

val extractedDf = tempDf.filter(size(split($"column_2"," ")) > 2)

最新更新