首先,感谢您抽出时间。我在pyspark中使用databricks,我尝试从json数据帧中过滤列,但不起作用。。。我尝试了其他的替代方案,例如df.where(col('name_column'((和,但没有结果。
我有下一个代码:
df_json = spark.read.json('/mnt/datalake/route/*.json').filter(array_contains("column_name", "value"))
我也尝试过这个:
df_json = spark.read.json('/mnt/datalake/route/*.json').filter(array_contains($"column_name", "value"))
为什么没有功能?,我想从数据帧中过滤所有结果,我试着阅读文档,但我没有结果。。。
我用心为你回应,谢谢!
解决方案是:
df_json=df_json.filter("ColumnName==‘Value’"(