小贝子编程

Spark SQL查询，以获取存储在AWS S3中的CSV格式的Athena表的最近更新的时间戳 &

本文关键字：Athena 格式 CSV 最近时间戳更新中的 S3 查询 SQL 获取 amazon-web-services amazon-s3 pyspark apache-spark-sql amazon-athena
更新时间 : 2023-10-10
英文 : Spark SQL query to get the last updated timestamp of a Athena table stored as CSV in AWS S3

是否可以使用Spark SQL查询以CSV文件格式存储在S3位置的Athena表的最后更新时间戳?

如果是，谁能提供更多的信息?

有多种方法可以做到这一点。

使用athena jdbc驱动程序并在格式为jdbc的地方执行spark读取。在这个阅读中，你将提供你的"select max(timestamp) from table";查询下一步，从spark数据帧
您可以完全跳过jdbc读取，只使用boto3来运行上述查询。它将是start_query_execution和get_query_results的组合。然后你也可以保存到s3。

最新更新

函数式语言类型推断混乱
使用Python从大文件解析数字数据时提高速度
如何从Multipass共享文件夹到主机?
从CMD或批处理文件中禁用"Notify me when the clock changes"设置
在Dockerfile中设置——net=host ?
如何在React中将arrayBuffer转换为JSON
是否有可能将html响应转换为json在扑动?
快速过滤numpy数组值的方法
C保存字符串的数组列表
需要minio film配置建议
如何应用CSS字体大小"relative to what it would be originally"？
该应用程序在个人帐户中未绑定脚本时被阻止错误
将原始查询转换为django orm
如何从出现次数和值的列表中创建一个新列表
使用Julia中的Julia Broadcasting根据数组的索引计算数组值
在javascript中使用条件更新嵌套数组
for循环多个条件
将第一列中的名称行转换为r中的列
Nx张量的映射切片
Dotnet Core Azure功能(隔离进程)如何加载应用程序.每个环境的Json
Discordjs不发送消息
边框在css中不显示
Python pandas中的深度嵌套JSON规范化
如何在JSON模式中从正确的对象中选择特定的字段
我可以在REST API中直接通过POST发送电话号码吗?
"onPressed: () {}"在颤振中不起作用
FbLitho在RecyclerCollectionComponent中重复视图，即使加载了新部分
Spring Data JPA对多对多关系的查询返回所有记录，而不是匹配的记录
在使用const断言递归时更改函数参数以接受子函数
我们可以通过调用Power BI Service/Workspace的export功能导出嵌入式Power BI报表的P

Spark SQL查询，以获取存储在AWS S3中的CSV格式的Athena表的最近更新的时间戳 &

相关内容

最新更新

热门标签：