小贝子编程

如何使用spark读取某些parquet文件分区?

本文关键字：parquet 文件分区何使用 spark 读取 apache-spark pyspark bigdata
更新时间 : 2023-09-22
英文 : How to read certain parquet file partitions using spark?

是否可以使用spark从文件夹中读取某些分区?

我只知道这样:df = spark.read.parquet("/mnt/Staging/file_Name/")

是否有办法只读取那些日期不小于今天减去3个月的分区?

如果你的数据框是按日期划分的，你可以使用filter, spark将只读取这个日期的分区

df = spark.read.parquet("/mnt/Staging/file_Name/").filter(col("your_date_col") === "2022-02-03")

最新更新

从CMD或批处理文件中禁用"Notify me when the clock changes"设置
在Dockerfile中设置——net=host ?
如何在React中将arrayBuffer转换为JSON
是否有可能将html响应转换为json在扑动?
快速过滤numpy数组值的方法
C保存字符串的数组列表
需要minio film配置建议
如何应用CSS字体大小"relative to what it would be originally"？
该应用程序在个人帐户中未绑定脚本时被阻止错误
将原始查询转换为django orm
如何从出现次数和值的列表中创建一个新列表
使用Julia中的Julia Broadcasting根据数组的索引计算数组值
在javascript中使用条件更新嵌套数组
for循环多个条件
将第一列中的名称行转换为r中的列
Nx张量的映射切片
Dotnet Core Azure功能(隔离进程)如何加载应用程序.每个环境的Json
Discordjs不发送消息
边框在css中不显示
Python pandas中的深度嵌套JSON规范化
如何在JSON模式中从正确的对象中选择特定的字段
我可以在REST API中直接通过POST发送电话号码吗?
"onPressed: () {}"在颤振中不起作用
FbLitho在RecyclerCollectionComponent中重复视图，即使加载了新部分
Spring Data JPA对多对多关系的查询返回所有记录，而不是匹配的记录
在使用const断言递归时更改函数参数以接受子函数
我们可以通过调用Power BI Service/Workspace的export功能导出嵌入式Power BI报表的P
如何使用Azure服务近乎实时地收听GCP pub/sub
如何一次只显示一个组中的几个精灵
在移动平均线的股票图表中增加成交量

如何使用spark读取某些parquet文件分区?

相关内容

最新更新

热门标签：