我想做这样的事情:
myEnum = Enum("myEnum", "Giraffe Crab Rat Human")
df_new = df.withColumn("AnimalEnumValueColumn", myEnum.Giraffe)
(我知道这是不正确的,但我想要一个具有相同预期效果的替代解决方案(
您需要使用.value
从枚举对象中获取值:
import pyspark.sql.functions as F
df_new = df.withColumn("AnimalEnumValueColumn", F.lit(myEnum.Giraffe.value))
有关更多详细信息,请参阅枚举文档。