小贝子编程

如何使用scala API在sparksql中编写大于1的特定列的计数

本文关键字：大于 API scala 何使用 sparksql apache-spark-sql
更新时间 : 2023-09-01
英文 : how to write a count of particular column greater than one in spark sql using scala API

我有以下SQL查询：

SELECT SECTOR, COUNT(REGION) FROM SAMPLE_TABLE GROUP BY SECTOR HAVING COUNT(REGION) > 1

我想使用SparkSQL的DataFrame API将其转换为Spark。我该怎么做？

也许这可以工作：

val df = sqlContext.table("SAMPLE_TABLE")
val newDF = df
  .groupBy("sector")
  .agg(count("region").as("cnt"))
  .where($"cnt" > 1)

有关更多信息，您可以查看DataFrame API文档和functions包文档

怎么样

    sqlContext.sql("SELECT SECTOR, COUNT(REGION) FROM SAMPLE_TABLE GROUP BY SECTOR HAVING COUNT(REGION) > 1
").take(1000).foreach(println)

使用API是什么意思？哪一个？

最新更新

如何从SQL Server的CustomerCode中过滤设计
Maven模块来扩展现有模块的功能
c - asprintf导致分段故障的核心转储
如何使用mapStateToProps在类组件在React?
切换图像onclick事件内联
无法解决 Multer错误：反应/表达中出现意外字段
如何将数字转换为python中的NaN值?
Flutter audio_service set rating
流量被发送到kubernetes中未准备好的pod
OptaPlanner中 ClassCastException由于groupBy操作导致
这个错误信息是什么意思:没有足够的数据来创建这个用户
如何在特定屏幕上隐藏持久的导航栏?
如何解析路径相对于工作区在Bazel?
PHP问题：高速公路的第8和第9入口不起作用
通过重新渲染调用多次的useQuery钩子只执行一次
git子模块更新--init--force--remote
不能从响应jaxb java转换为布尔值
检测活动-眼睛眨眼和微笑的概率与ML KIT Android
我在三中看不到物体.js
在函数中使用单词列表
如何将此SQL转换为压缩
backbuttondisplaymode in swiftUI
Django -单元测试对象是否被删除-如何使用assertRaise / DoesNotExist异常
如何以这种格式发送数据我有这个模型，我想要这种格式
<img> 语义 HTML 中是否允许在内部使用<li>标记？
连接Bigquery中的区间聚合数据
pycharm项目丢失了源根，没有显示
按数组字符串过滤对象数组，并与对象的子字符串匹配
有时需要多次刷新才能加载Angular 14构建的网站
为什么console.log显示我在html文档中有0个加载的图像?

如何使用scala API在sparksql中编写大于1的特定列的计数

相关内容

最新更新

热门标签：