小贝子编程

Spark 群集中的 Hive 查询

本文关键字：Hive 查询集中群集 Spark apache-spark hive
更新时间 : 2023-09-17
英文 : Hive queries in Spark cluster

我需要了解如何在Spark集群中执行hive查询。它将作为在内存中运行的Mapreduce作业运行，或者它将使用Spark架构来运行Hive查询。请澄清。

如果你在蜂巢或直线中运行蜂巢查询，它将使用 Map-reduce，但如果你在 spark REPL 或编程中运行蜂巢查询，查询将简单地转换为数据帧，并创建与数据帧相同的逻辑和物理计划并执行。因此将使用火花的所有力量。

假设你有一个配置了 YARN 和 Spark 的 Hadoop 集群;

Hive 执行引擎由hive.execution.engine属性控制。根据文档，它可以是mr(默认(，tez或spark。

最新更新

Django模板-如何在子对象的forloop中显示子对象为null时显示父对象
如何处理在另一个屏幕中获取的数据?
当输入有效的成员号时未执行返回语句
检查两个字符串的相等性在javascript中不能正常工作
使用laravel从数组中获取值
升级到Expo SDK 48.0.10后，应用卡在启动界面
如何创建一个循环，输出给定的列表(包括数字)
所有的酒吧/蜡烛都在粉刷
这个字段是Django的哪个字段以及如何使用它?
使用# id更改HTML模板中的JS代码值
Regex语句，用于捕获最外层括号内的元素
如何在用户猜测/输入后更改占位符?
是否有一种方法来创建一个DataFrame从特定的颜色编码行是在谷歌工作表?(长颈鹿和熊猫)
AWS Glue: SCRAM认证需要libpq版本10或以上[Using CockroachDB]
如何使用信号协议加密/解密?
pandas dataframe在特定列中的列表值满足一定条件时获取行
&16 在此 MySQL 查询中做什么？
是否有办法使类名作为一个变量?．. Parent_class *p_derived = new classnameher
错误:未能将一些参考推入' path '
我如何让matplotlib正确格式化这些datetime64对象?
如何删除重复的行基于多列值在亚马逊雅典娜?
无法"npm install"项目
Applescript在文件夹中搜索带有关键字的照片
在CocoaPods任务中运行管道时出错
我是如何设法在通常的 conf 设置之外定义一个 XAMPP Apache 额外目录的？找不到证据
我的主要分支是错误的，我想用另一个分支重写它，我怎么能做这样的事情?
防止在for循环中展开的函数的形参中展开变量
自动伸缩组实例未在ALB上注册
我有一个问题与基础SQLITE3，如何解决它?
react useEffect(): Hello只记录一次

Spark 群集中的 Hive 查询

相关内容

最新更新

热门标签：