小贝子编程

Amazon s3 上的 Hive 分区外部表上的 SparkSQL

本文关键字：SparkSQL 外部分区 s3 上的 Hive Amazon apache-spark amazon-s3 hive apache-spark-sql
更新时间 : 2023-09-10
英文 : SparkSQL on hive partitioned external table on amazon s3

我计划在Amazon S3中的数据之上使用SparkSQL(不是pySpark(。所以我相信我需要创建Hive外部表，然后可以使用SparkSQL。但是 S3 数据是分区的，并且还希望分区反映在 Hive 外部表中。

每天管理配置单元表的最佳方法是什么。因为，可以每天创建新分区或旧分区覆盖和做什么，以便保留Hive外部表最新的？

创建一个中间表并加载到您的 Hive 表，并在日期插入覆盖分区。

最新更新

计算IP地址所属子网
如何验证一个数组与react挂钩形式?
动态数组线性搜索函数的实现
我如何管理模型，当我有多种语言的网站laravel
无法排序或打印出数组
如何将Laravel控制器返回到多个视图文件?
无法在 Android 上显示地图，但在 iOS 上可以显示地图
价格书可以手动共享吗?如何?
vaadin.url映射前端资源
在WordPress的评论字段后面添加验证码
谷歌分析电子表格附加组件-过滤和排序的主要结果
如何摆脱不安全的链接
多项式坐标
如何在表格css中强制换行
Azure Active Directory -如何在租户下为我注册的应用程序提供http重定向 &
将列值的第一行转换为标题或将行转换为标题
如果在vb.Net中满足条件，则更改Excel区域中的行颜色
pyparsing异常解释:需要更精确的错误位置信息
从TXT文件中获取最后10行并排序
Not Like在循环数组时不起作用
c# Windows窗体和MVVN -它是如何正确的?
Mapbox -悬停在多边形上根本不起作用.如何让它与矢量数据的工作?
CSS z-index和移动设备
找不到 Flutter 'FirebaseCore/FirebaseCore.h' 文件
curl:(26)从appcenter的文件/应用程序打开/读取本地数据失败
剧本无法从角色内部的循环变量中找到"{{ item }}"
当imagflow删除缓存图像时
为什么concat也显示在这个选择查询中
将python控制台应用程序转换为web应用程序的最简单方法
JavaFX 将折线图导出到 png 不会正确呈现图表，如果图表未置于前台

Amazon s3 上的 Hive 分区外部表上的 SparkSQL

相关内容

最新更新

热门标签：