小贝子编程

FilterPredicates当前不支持在spark 3x中重复

本文关键字：3x spark 不支持 FilterPredicates java apache-spark apache-spark-sql
更新时间 : 2023-09-21
英文 : FilterPredicates do not currently support repeated in spark 3x

我无法在spark 3.2.0 中的数组列中进行筛选

查询：

df.filter(col("src").getItem(0).equalTo("uid2")).show(false)

但它返回异常：

WARN scheduler.TaskSetManager: Lost task 0.0 in stage 12.0 (TID 36) (hadoop4964 executor 2): java.lang.IllegalArgumentException: FilterPredicates do not currently support repeated columns. Column src is repeated.

谁能帮我修？

可能是Spark 3.2.X中的一个问题。

请参见此处：https://www.mail-archive.com/dev@spark.apache.org/msg29086.html

降级将解决这个问题，你也可以尝试升级到3.3.X，看看问题是否持续存在(我相信会的(

同时，一个变通方法是禁用镶木地板的谓词下推

spark.sql.parquet.filterPushdown=false

最新更新

如何在gitlab ci中定义动态分支
如何制作一个记录事件的discord.py bot ?
Laravel对重复数据的集合求和
如何将具有相同类的多个元素更改为数组项列表
我将一个字符串转换为float，如何验证它是f64
如果pandas数据框架的一个单元格包含所有大写字符串的列表，则从该数据框架中删除一行
如何按开始时间和结束时间对日期数组进行分组，并减去最后一个值-第一个值
在页面中间改变滚动方向，然后返回
JavaScript如何for循环不同的元素作为一个变量在相同的函数中应用
Android Jetpack撰写和导航
payfort "response_message"："带有标记化的无效命令
如何检查我的"npx 安全帽编译"是否正常工作
OSError: -6在Micropython中进行简单的API调用时
带有AND操作符的For循环数组
无法从VPC内访问S3桶上托管的静态网站
使用Numpy Array在每个像素时间序列的特定位置插入值
如何在minikube上部署elasticsearch
如何在点击页面导航链接时停止屏幕滚动，React-Bootstrap和Gatsby
无法在本地种类群集中装载本地主机路径
不能将带有多个对象的文件从React上载到.net Core 5
在Python中找到蛋糕的最大块数
Mongodb:如何将$facet输出2乘以2合并
添加https到数组的缺失字符串?
如何使用bigquery在带有通配符的字符串列表中测试字符串
如何处理Vuex/Pinia商店中的关系并保持同步?
如何制作一定大小的列表(k)
django多对一关系
Powershell调用- webrequest追加到文件而不是写入
R difftime()产生不正确的间隔
SQL查询从两个表中减去值

FilterPredicates当前不支持在spark 3x中重复

相关内容

最新更新

热门标签：