现在我有一个pyspark数据框架:
x_data y_data
2.5 2.5
2.5 2.5
2.5 2.5
2.5 2.5
,我希望所有行的值都是"Smith">
**How do I create a data frame like this using pyspark?**
x_data y_data Name
2.5 2.8 Smith
7.5 5.1 Smith
1.5 1.5 Smith
8.5 6.5 Smith
您可以使用withColumn
添加一个新的文字列:
import pyspark.sql.functions as F
df2 = df.withColumn('Name', F.lit('Smith'))