小贝子编程

如何从优化中获得p50FileSize(没有使用历史记录)?

本文关键字：历史记录优化 p50FileSize apache-spark apache-spark-sql delta-lake
更新时间 : 2023-09-22
英文 : How to get p50FileSize from OPTIMIZE (with no use of history)?

我想从优化查询返回后获得p50FileSize指标。目前看来，完成此任务的唯一方法是:

spark.sql("OPTIMIZE .delta 'path'")
dt = DeltaTable.forPath(spark, 'path')

然后从dt获取历史和操作更快的方法是在查询之后立即提取此数据:

data = Spark.sql("OPTIMIZE .delta 'path'")

从数据中获取度量，但是p25FileSize, p50FileSize, p75FileSize没有度量。有没有一种方法可以在不调用.history()命令的情况下获得这些指标?

是否有一种方法可以在不调用.history()命令的情况下获得这些指标?

tl;博士No (Delta Lake 1.2.1)

内部

看起来指标只计算要提交的事务，并且在执行OPTIMIZE时不会返回。

最新更新

创建一个Python字典，以开始值和结束值作为键
根据列唯一值对组执行多元线性回归
如何在VS Code中添加扩展的Git提交消息
是否有办法捕获HTTP响应中的错误(例如状态码500)，然后在selenium中失败脚本?
mysql恢复命令和授予特权
在r中使用lubridate make_datetime后的未知日期列类
如何从Firebase认证获得Twitter用户名- Javascript
在哪里存储凭证和其他机密的Apache Flink SQL?
包含具有相同外键的相关对象的查询集
为什么getter触发器有时在模板中?
使用ansible访问字典文件列表
奇怪的uint8_t转换与OpenCV
C语言在介子中的覆盖报告
如何根据第二个表的条件从一个表中选择值?
为什么在下一个.js " use client "组件顶部给我这个错误？
正在文本文件中搜索字符串，但得到多个结果
如何在链表中使用复制赋值操作符
CycloneDX v2.1.2 -如何使用CycloneDX v2.1.2为.net框架项目生成依赖关系图
如何对一般嵌套的TypedDict进行类型注释?
Web代码只是不工作-文本不断弹出动画后
如何使用VBA根据电子邮件的主题提取Outlook电子邮件数据?
为什么 H2 不能创建此表？
按下按钮后功能并行或同时计算
Gradle无法获取Unity Mediation、Firebase和Google Play Service的依赖项.&
使用两个表在mysql数据库中按国家查找用户
如何从appsettings.json获得日期时间?
配置组到springdoc openapi
用连字符替换laravel路由URL模式中的正斜杠
获胜团队(班级)场景
可以解构来自SWR查询的结果吗?

如何从优化中获得p50FileSize(没有使用历史记录)?

相关内容

最新更新

热门标签：