小贝子编程

Spark 是否支持所有节点上的用户定义的内存中数据结构?

本文关键字：定义用户内存数据结构支持是否节点 Spark apache-spark apache-spark-sql
更新时间 : 2023-08-30
英文 : Does Spark support user-defined in-memory data structure over all nodes?

我正在使用Spark SQL，并对它的美丽功能感到满意。

我想在 Spark sql 支持的 SQL 语句中添加用户定义函数（UDF）。我有一个二进制格式的位图数组数据，它用作 UDF 的布隆过滤器。

我可以强制每个工作线程实例将整个数据结构（布隆过滤器）保留在内存中并将其与 UDF 一起使用吗？

谢谢

闭包中引用的每个本地对象都将被简单地序列化并与相应的任务一起传输。除此之外，Spark 不会应用任何特殊转换 - 如果您有本地内存数据结构，当您在任务中使用它时，它不会更改。

最新更新

获取双引号内的信息
如果用户输入的是字母而不是数字，如何在循环中添加错误语句?
keyboard.is_pressed()打破循环
python fastapi给出错误的响应
如何使一个选择元素可访问，如果它没有标签?
在Scala中创建一个没有参数的匿名函数
如何在Vue.js中传递URL给iFrame
如何从Oracle视图中提取FROM子句的内容
如何在Java中正确使用Spark SQL缓存?
文本、IF和Else语句、ActionScript
在这种情况下如何从API调用console.log数据?
Coinbase API认证总是无效的Java签名
根据行名有条件地减去Pandas Dataframe行
如何使用QUdpSocket接收大量数据?
javax - persistence:实体没有使用Java记录的主键
从Kaggle读取数据集
为grails中的hasMany字段设置XmlAttribute
从运输表中获取独特的车道
Colab的生产率:直接从网络加载(例如:Kaggle)数据库还是将它们上传到colab目录，然后提取它们?
使用下拉列表中的名称
分析字符串，看是否有元音和两个连续的字母
flutter应用程序在内部测试中崩溃(在我的手机上运行良好)
拉拉维尔简单授权 - 有时不起作用 - "Invalid credentials."
名称空间在引入c++ 98标准之前存在吗?
为什么模型文本不显示在html中?
仅在特定行上使用SUMPRODUCT的最佳方法?
Quickblox扑动自定义对象更新不工作
机器人没有权限时的 discord.py 例外
如何以编程方式触发自动完成数据列表
是否有任何C实现中的指针不表示为指针指向的内存地址

Spark 是否支持所有节点上的用户定义的内存中数据结构?

相关内容

最新更新

热门标签：