小贝子编程

Pyspark映射一个函数到两个数组类型

本文关键字：两个数组类型一个映射 Pyspark 函数 function dictionary pyspark
更新时间 : 2023-09-22
英文 : Pyspark map a function to two array type

我对Pyspark很陌生，这是我想做的，下面是表格，类型是ArrayType(DoubleType), ArrayType(DecimalType)

<表类> B tbody><<tr>[1, 2](2、4)(1、2、4)(1, 3, 3)

您可以使用pandas_udf

示例数据

df = spark.createDataFrame([
([1,2], [2,4]),
([1,2,4], [1,3,3]),
], 'a array<int>, b array<int>')
df.show()
+---------+---------+
|a        |b        |
+---------+---------+
|[1, 2]   |[2, 4]   |
|[1, 2, 4]|[1, 3, 3]|
+---------+---------+

创建pandas_udf列

@F.pandas_udf("array<int>")
def func(a, b):
return a * b
df.withColumn('c', func('a', 'b')).show()
+---------+---------+----------+
|        a|        b|         c|
+---------+---------+----------+
|   [1, 2]|   [2, 4]|    [2, 8]|
|[1, 2, 4]|[1, 3, 3]|[1, 6, 12]|
+---------+---------+----------+

Pyspark映射一个函数到两个数组类型

相关内容

最新更新

热门标签：