小贝子编程

如何在S3中解压缩.gzip文件，应用一些sql过滤器，并在S3中将结果存储为json

本文关键字：S3 并在过滤器存储 json sql 结果应用解压缩 gzip 文件 amazon-web-services amazon-s3 aws-lambda
更新时间 : 2023-09-20
英文 : How to decompress .gzip file in S3, apply some sql filters, and store the result back as json in S3?

因此，我收到了S3格式的每小时数据。我打算一起读取特定S3目录中的所有.gz文件。然后，对数据应用一些sql过滤器，并将结果作为json存储在不同的S3位置。

这可以通过lambda函数实现吗？如果可能的话，请分享代码片段。

或者这需要其他架构吗？

这基本上是一个ETL过程。我建议你使用AWS胶水。这是一个完全托管的ETL服务，您可以在其中编写PySpark脚本。在那里，您可以从S3加载数据，使用PySpark SQL API并用JSON将其写回到不同的S3位置。

最新更新

我有一个 roblox leaderstats 脚本，在 3 个不同的文件夹中有 2 个 IntValues，但它们无法正确保存。我不知道怎么了。我没有收到任何错误
为什么我得到Nodemailer不能/POST错误?
将数组转换为对象-具有特殊条件
如何在 JavaScript 中检查"is not defined" eval(var)？
错误NETSDK1152在WinUI3应用程序:发现多个发布输出文件具有相同的相对路径:Microsoft.Web.We
当我在Ubuntu16中使用字符串命令查找一些东西时，我没有得到任何输出
Apache Spark: parse PT2H5M (duration ISO-8601) duration以分钟为单
如何在Parent还没有Id时添加Child
无法记录android应用程序的jmeter脚本
使用AsyncRabbitTemplate::sendAndReceive - RabbitMQ时的应答超时
是自定义文件扩展名吗?
选择远程docker容器(没有kubernetes)后， JVM列表为空
c# TwinCAT数据类型的等效枚举
传递地址时，函数与函数模板的语法限制
如何将flutter riverpod ref.read()函数传递给另一个小部件
Pug/Node.js中的循环优化
Postgresql函数在删除t_providers的行之前作为触发器
在Python中替换字符串中类似模式的正则表达式
Azure DevOps YAML:带有模板变量的If-else条件不起作用
我有麻烦管理我的循环while loo[，反之亦然
我怎么能使最后一行从图在PHP?
无法使用引导折叠折叠
当cell1的值大于cell2的值时显示模态对话框
Vue模板使用JavaScript内置函数
使用python中除"in"以外的其他运算符"match"函数
Powershell Where-Object returning null
在React中通过ClassName Prop扩展样式
如何缩小Firestore字段值
导入谷歌地图模块时反应错误
按顺序切换Class

如何在S3中解压缩.gzip文件，应用一些sql过滤器，并在S3中将结果存储为json

相关内容

最新更新

热门标签：