在spark数据框架中,我想转换日期列,"日期"这是在字符串格式(例如。20220124)到2022-01-24,然后使用python到日期格式。
df_new = df.withColumn("日期",to_date (df。日期、yyyy-MM-dd))
您可以使用to_date函数来完成此操作,该函数获取日期的输入颜色和格式。
from pyspark.sql import functions as F
df.withColumn('date', F.to_date('date', 'yyyyMMdd'))