小贝子编程

根据条件将列添加到Pyspark数据框架中

本文关键字：Pyspark 数据框架添加条件 python apache-spark dataframe pyspark apache-spark-sql
更新时间 : 2023-09-09
英文 : Add column to pyspark dataframe based on a condition

我的data.csv文件具有以下三个列。我已经将此文件转换为Python Spark DataFrame。

  A   B    C
| 1 | -3 | 4 |
| 2 | 0  | 5 |
| 6 | 6  | 6 |

我想在Spark DataFrame中添加另一列D，其值为"是"或"否），如果B列中的相应值大于0，则是YES，否则否。

  A   B    C   D
| 1 | -3 | 4 | No  |
| 2 | 0  | 5 | No  |
| 6 | 6  | 6 | Yes |

我无法通过Pyspark DataFrame操作实现此目标。

尝试这样的东西：

from pyspark.sql import functions as f
df.withColumn('D', f.when(f.col('B') > 0, "Yes").otherwise("No")).show()

最新更新

discord bot分片，并从数组结果中处理对象
python patoolib可执行文件句柄无效
测试时间序列数据中未戳的分钟数
如何在cloud Foundry的内部域中(apps.internal)为运行的应用创建用户提供的服务
在Jupyter Notebook中显示未显示在if-else块内的HTML类
如何控制可变的输入量- React
从json文件中创建gcloud配置
为用户代理(即操作系统)设置值的自定义代码
当我在c++中使用类中的类时得到警告
ImageMagik图片渲染不正常，白色方块布满图片
崩溃时，解构boost io_service
None typeobject in success_url django
在amazon eks kubernetics环境之外运行的Ignite厚客户端是否有可能访问amazon eks ku
Jest (ESM)在单元测试中会从React Native加载文件
Optimize Spark Shuffle Multi Join
如何把不同的图像和重定向用户到ListView Builder的其他页面?
在Thingsboard k8s部署版本，我怎么能改变' JWT_TOKEN_EXPIRATION_TIME ' ?&l
生成可变分钟间隔
如何将动画添加到可编写脚本的对象?
是春季安全ACL应该是可用的WebSecurityExpressionHandler?
在python中处理全局变量
Cypress:代码进入无限循环，当满足条件时无法打破循环
如何在Django中使用本地SQLite3数据库进行测试和MSSQL数据库进行生产?
绘制没有插值的动画
Javascript动画只占屏幕的一半
Ansible - 模板字符串时列出比较问题：预期的令牌"："，'}'
()->() 不能符合形状样式
Oracle SYSDATE - 1/8是什么意思?
使用c#上传xml文件到Azure FTP文件夹
在多个钱包之间分配铸造资金 solana metaplex & candymachine

根据条件将列添加到Pyspark数据框架中

相关内容

最新更新

热门标签：