3
如何进行求和频率基于不同的ID &位置在PySpark吗?
感觉我需要通过ID和位置做窗口分区,然后添加频率,但不确定如何在Pyspark代码中编写此:
输入>我认为你可以使用GroupBy
函数。
yourInput.groupBy("ID",Location).sum("Frequency").alias("TotalFrequency").show(truncate=False)
注意:请查看pyspark中的聚合函数链接
只是一个简单的group by and sum:
import pyspark.sql.functions as F
df2 = df.groupBy('ID', 'Location').agg(F.sum('Frequency').alias('TotalFrequency'))
首先将dataframe创建为table然后可以从该表中进行查询然后使用常规查询
dataframe.createOrReplaceTempView("mytable")
"select id, location, sum(Frequency) from mytable
group by id, location"
相关内容
- 在pandas数据框中有两列的数据.一列是可以重复的月份,另一列是购买量.每月需要总额
- R- for循环在数据帧中选择两列,只有第二列改变
- Excel公式,用于检查两列的值并返回特定的单元格值
- 从数据框的两列中提取值并将其放入列表中
- 遍历MySQL表的两列
- SQL生成按ID分组的两列之间的数字列表
- 在snowflake sql中基于两列的unpivot
- 在Python Pandas中,我如何基于两列连接df的行?按照第三个的顺序呢?
- 检查两列值的无序对是否相同,并使用groupby减少(方向和)
- 如何基于第三列有条件地组合两列
- 如何比较Mysql上两个不同表的两列
- 如何排序二维数组的两列,从大到小,由第二列?
- 连接两列,如果重复则保持唯一值
- 如何根据PySpark两列的区别获得总数?
- 没有联接的两列之间的区别?
- 添加两个 Pandas 数据帧列,其区别仅在后缀参数上,例如 "A_x" 、"A_y"并将这两列添加重命名为 "A"
- 使用 Java 的 Spark 数据帧中两列的区别
- 创建两列索引和在两列上创建单独索引的区别
- 在另一列上分组的两列的区别
- 基于Python Panda的两列区别两个数据框
最新更新
- 如何使用Pandas数据框架将R代码语法转换为Python语法?
- 当我运行服务器我得到这个错误:Django 405错误
- 如何将列表中的每个数字与另一个列表中的每个数字相乘
- 用其他字典中的值替换字典中值列表中的元素
- super() 不能递增父类的类变量,但它会更新父类的类字典
- Java中的冗余赋值vs赋值前检查
- 输入数据量变化;需要的建议
- 根据键合并两个数组,并使用mongo聚合添加新字段
- 显示头表,从数组的子列- Angular
- 如何上传AppendBlob/一个大于4mb限制的文件到Azure存储/Blob在Java?
- client_loop: send disconnect:长时间运行jenkins管道时管道破裂问题
- 使用 python 跟踪游戏不断更新的日志文件的最佳方法是什么?
- Gsutil 错误"Caught socket error, retrying: timed out "
- 如何在<h3>相同的高度制作
- #address 单元的 DTC 编译错误 = <2> 大小写
- 遵循Flutter web的重定向url
- 从数据库中获取值作为表
- 我们可以通过在一个应用程序中拥有更多(比用户机器上其他运行的应用程序)线程/进程来窃取更多的CPU时间/资源吗?<
- 如何在vue js中基于数组唯一id的选择选项中显示数据
- React中的 useRef语法
- 如何在react native图像滑动框中更改图像大小
- 绘制函数CustomPaint和PictureRecorder以不同的大小工作
- docker 无法连接到 docker 守护程序,但已创建套接字
- 无法解析Java程序中的@param注释
- 在互斥锁上使用多个std::unique_lock,所有线程在FIFO等待进程?
- Command error out with exit status 1: python setup.py egg_in
- 当NPM应用在子文件夹中时,NPM版本命令不创建git标签
- Prometheus导出器的正则表达式模式
- Lua代码构建具有重复功能的堡垒之夜问题
- JsonPath - Restrict To Research to One level
热门标签:
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium