使用 PySpark 的 "python enum" 的最佳方法( "myColumn" , myEnum.Giraffe)



我想做这样的事情:

myEnum = Enum("myEnum", "Giraffe Crab Rat Human")
df_new = df.withColumn("AnimalEnumValueColumn", myEnum.Giraffe)

(我知道这是不正确的,但我想要一个具有相同预期效果的替代解决方案(

您需要使用.value从枚举对象中获取值:

import pyspark.sql.functions as F
df_new = df.withColumn("AnimalEnumValueColumn", F.lit(myEnum.Giraffe.value))

有关更多详细信息,请参阅枚举文档。

最新更新