小贝子编程

在运行时评估PySpark UDF参数

本文关键字：UDF 参数 PySpark 评估运行时 python apache-spark pyspark
更新时间 : 2023-09-21
英文 : Evaluating PySpark UDF arguments during runtime

我有一个注册到pyspark的udf，它的任务是通过使用函数的参数a和b构建url来查询web。在运行时，它在print语句中将参数求值为Column<b'(colA + colB)'>。

如何获取参数a和b中的字符串？

def udf_func(a, b):
print(a + b)
return requests.get(a + b)
get = udf(udf_func, ByteType())
df = df.withColumn("output", get(col("colA"), col("colB")))

感谢

您可以如下修改您的函数：

def udf_func(a, b): return requests.get(a + b)
get = udf(lambda a,b : udf_func(a,b), ByteType())
df = df.withColumn("output", get(col("colA"), col("colB")))

我不相信你可以在udf中打印值，因此我已经删除了它，但这应该对你有效。

最新更新

C对文本文件中的整数进行选择排序，并将排序后的数字写入新文件
如何使Java Rest API在处理前半部分后返回响应，然后在返回响应后继续后半部分?
SvelteKit未看到[id].苗条的文件
Gitlab CI and php verstion
ROS2-Gazebo:在立方体的一侧显示图像
appery.模态离子1中的IO固定组件
一种检查is_explicit _constructible的方法
从电子表格自动填充谷歌文档
由CSS值更改触发的CSS动画
CSS Sticky属性在本演示中不起作用
NodeJs与xmlrpc服务器通信，并对node-xmlrpc库进行base64编码，将下载的url图像编码为base
在管道中使用powershell如何使用在azure devops中触发的管道运行来获取shelvesset编号.<
我希望在表格单元格内的左、右位置的同一行中有不同的文本
Entity Framework ExecuteDelete没有按预期工作
颤振只加载某些riv (.riv)文件
Python问题我如何循环回我的代码?
asyncpg.exceptions.InvalidAuthorizationSpecificationError Py
为什么我的阅读更多按钮不工作?
如何得到拆分字符后的单词
在列表框之间移动项
设置 SKEmitterNode 的 'targetNode' 会导致奇怪的 'zPosition' 行为
我无法在斐波那契数列 python 中加强术语
用Jest测试使用jquery获取数据的异步函数
c#与HTML敏捷包不能得到div类的值
Python 中的 OOP 层次结构
我如何动画下拉菜单的高度使用顺风css
无法从字符串比较失败的字符串中删除"—"
无法获取熊猫数据帧中的第一列值
Odoo添加按钮应该重定向到我的模块视图
r语言 - 我如何得到比例在数据表没有组号重复?

在运行时评估PySpark UDF参数

相关内容

最新更新

热门标签：