小贝子编程

Spark DF CacheTable方法.它会将数据保存到磁盘吗?

本文关键字：保存磁盘数据 CacheTable DF 方法 Spark apache-spark apache-spark-sql
更新时间 : 2023-08-22
英文 : Spark DF CacheTable method. Will it save data to disk?

我正在编写一个spark程序，我们将从数据库中读取1亿条记录。

我们正在从JDBC读取数据并创建DF。我想缓存DF，因为它将在多次迭代和计算中使用。

我的问题是，如果我使用DF cachetable()，数据将只保存在内存中。因为数据库读取是昂贵的，我不想再次读取失败的情况下

在RDD持久功能，我们有保存RDD到磁盘的选项?我们可以在数据帧缓存中做到这一点吗?我不想失去缓存表的优化也

它将使用MEMORY_AND_DISK:

def cache(): Dataset.this.type

使用默认存储级别(MEMORY_AND_DISK)持久化此数据集。

最新更新

完全卸载自制程序
尝试在go中使用通道，但数据无法正确发送/接收到通道
在析构函数中调用join()时的不一致行为
如何用管在三轴中连接两点?
Xamarin的.列表视图上的TapGestureRecognizer在有元素时不起作用
props是已定义的，但下面是undefined
mysqlworkbecnh与mysql的连接
Discordjs "createMessageComponentCollector"从其他消息中收集交互
我想创建一个程序，通过使用结构来计算学生的结果并打印位置
使用SQL窗口函数计算会话的开始和结束
我得到一个502坏网关错误与django应用程序在AppEngine
使用ngram的elasticsearch中的子词搜索不起作用
用 C 语言编写纸牌游戏"War"
AWS中的 s3访问触发器
如何用API调用返回的数据填充Angular Boostrap Table Widget ?
HTML CSS -在表格单元格中心像弹出一样缩放div
在docker桌面列表中持久化容器/应用
Apache AuthLDAPBindDN指令接受任何字段?
id(String)方法调用允许在插件{}脚本块错误
python中的类、属性和方法
为什么float是准确的，Decimal是错误的
数据类型问题从Synapse到Delta表在Databricks?
使用列表值创建二进制矩阵
如何为被轻敲的键和被保持1000毫秒的键制作不同的热键
在MVVM Jetpack Compose上添加依赖项时重复类错误
列表理解不会消除重复项
Windows -有效地将大量数据打印到终端
R函数转换为HTML
裸机中的 Kubernetes 证书管理器问题：等待 HTTP-01 质询传播：状态代码"403"错误，预期'200'
使用钩子将状态从一个组件传递到另一个组件(不是子组件)

Spark DF CacheTable方法.它会将数据保存到磁盘吗?

相关内容

最新更新

热门标签：