小贝子编程

有可能像数据库一样使用Spark吗

本文关键字：一样 Spark 数据库有可能 database dataframe apache-spark
更新时间 : 2023-09-19
英文 : Is it possible to use Spark like a Database?

我是Spark的新手。从输入流中，我得到了一个数据帧，但我不明白数据帧是否像关系表。如何将输入流保存到我的分布式文件系统中？一个数据帧足以做到这一点吗？感谢

Spark是一个易失性存储器，即它将所有的都保存在内存中。在数据进入内存之前，您可以使用Spark API或SQL查询数据。所有数据都需要使用Spark作业重新加载。

对于持久性，您还可以将Spark数据帧保存为持久性磁盘上的镶木文件，并通过Spark或hive进行查询。

否。您不能将spark用作数据库。Spark是一个不受信任的处理引擎。您可以使用HDFS来存储数据帧。您还可以使用Hive、Hbase等来存储数据帧。

最新更新

GitHub上下文变量未针对可重用工作流引用进行评估
停止滑动眼睛.IO克隆，相位器3
我正在尝试运行美洲驼索引模型，但是当我进入索引构建步骤时 - 它一次又一次地失败，我该如何解决这个问题？
502坏网关与Nginx服务器托管.net核心项目
LG Hub Script Non-Functional
c -对齐检查在WebAssembly时，模拟XMM的内在?
我的多线程代码与c++不能正常工作
如何在SQL数据库行中存储一对多关系?
向b-tree索引更新具有相同值的列
在c++中，用引号和空格之间的键/值加载文件的最有效方式是什么?
Java多线程并发与并行
在启动画面中淡入和淡出图像
多个模型到一个manytomanyfield表
Javascript-如果array2部分排序为array1，则检查数组
为什么我的Biquad过滤器没有从我的噪音正确断开?
删除nullptr对象可能调用也可能不调用释放函数.为什么不保证后者呢?
Azure SQL Hyperscale-0个辅助副本
我使用的只是音频在扑动应用程序，从url播放，在真实设备上的一段时间后，应用程序停止，试图在后台播放音频
使用正则表达式模式的小写文本
Java -不同语言的字符串
c - WSL:功能未实现
我如何轻松地重新安装所有卸载的VS Code扩展，他们的文件仍然徘徊在我的~/.vscode /扩展文件夹吗?<
使用MS Graph API在应用注册中添加更多应用角色
PAC文件未正确筛选网站
返回一个字典，每个字符都有多个实例
AWS S3 -仅Zip文件对象，而不是路径
公共api如何处理CORS起源和jwt ?
如何摆脱实际上"duplicates"几乎等同的调用行，实际上只切换了部分列数据？
如何在换行时中断文本?
使用流JAVA 8将map转换为特定的dto对象

有可能像数据库一样使用Spark吗

相关内容

最新更新

热门标签：