小贝子编程

如何使用Hive仓库连接器在pyspark中执行HQL文件

本文关键字：pyspark 执行 HQL 文件连接器何使用 Hive apache-spark pyspark hiveql
更新时间 : 2023-09-17
英文 : How to execute HQL file in pyspark using Hive warehouse connector

我有一个hql文件。我想使用带有 Hive 仓库连接器的 pyspark 运行它。有一个 executeQuery 方法来运行查询。我想知道 hql 文件是否可以这样运行。我们可以运行这样的复杂查询吗？请指教。

谢谢

我有以下解决方案，我假设 hql 文件中会有多个查询。

HQL 文件： sample_query.hql

select * from schema.table;
select * from schema.table2;

代码：遍历每个查询。您可以在每次迭代中随心所欲地执行(就 HWC 操作而言(。

with open('sample_query.hql', 'r') as file:
hql_file = file.read().rstrip()

for query in [x.lstrip().rstrip() for x in hql_file.split(";") if len(x) != 0] :
hive.executeQuery("{0}".format(query))

最新更新

使段落出现，并使其在点击显示下一个段落时消失
GROUP_CONCAT(DISTINCT xxx)将连接值的顺序颠倒
r语言 - 循环遍历列表的列表
如何使用Pandas数据框架将R代码语法转换为Python语法?
当我运行服务器我得到这个错误:Django 405错误
如何将列表中的每个数字与另一个列表中的每个数字相乘
用其他字典中的值替换字典中值列表中的元素
super() 不能递增父类的类变量，但它会更新父类的类字典
Java中的冗余赋值vs赋值前检查
输入数据量变化;需要的建议
根据键合并两个数组，并使用mongo聚合添加新字段
显示头表，从数组的子列- Angular
如何上传AppendBlob/一个大于4mb限制的文件到Azure存储/Blob在Java?
client_loop: send disconnect:长时间运行jenkins管道时管道破裂问题
使用 python 跟踪游戏不断更新的日志文件的最佳方法是什么？
Gsutil 错误"Caught socket error, retrying: timed out "
如何在<h3>相同的高度制作
#address 单元的 DTC 编译错误 = <2> 大小写
遵循Flutter web的重定向url
从数据库中获取值作为表
我们可以通过在一个应用程序中拥有更多(比用户机器上其他运行的应用程序)线程/进程来窃取更多的CPU时间/资源吗?<
如何在vue js中基于数组唯一id的选择选项中显示数据
React中的 useRef语法
如何在react native图像滑动框中更改图像大小
绘制函数CustomPaint和PictureRecorder以不同的大小工作
docker 无法连接到 docker 守护程序，但已创建套接字
无法解析Java程序中的@param注释
在互斥锁上使用多个std::unique_lock，所有线程在FIFO等待进程?
Command error out with exit status 1: python setup.py egg_in
当NPM应用在子文件夹中时，NPM版本命令不创建git标签

如何使用Hive仓库连接器在pyspark中执行HQL文件

相关内容

最新更新

热门标签：