如何在pyspark中创建行值相同的新列?



现在我有一个pyspark数据框架:

x_data  y_data
2.5      2.5
2.5      2.5
2.5      2.5
2.5      2.5

,我希望所有行的值都是"Smith">

**How do I create a data frame like this using pyspark?**

x_data  y_data    Name
2.5      2.8      Smith
7.5      5.1      Smith
1.5      1.5      Smith
8.5      6.5      Smith

您可以使用withColumn添加一个新的文字列:

import pyspark.sql.functions as F
df2 = df.withColumn('Name', F.lit('Smith'))

最新更新