小贝子编程

Cassandra(使用Hadoop)与Spark的性能

本文关键字：Spark 性能使用 Hadoop Cassandra apache-spark hadoop cassandra
更新时间 : 2023-09-15
英文 : Cassandra(with Hadoop) performance with Spark

我们在与Cassandra不同的一组节点上运行Spark/Hadoop。我们有10个Cassandra节点和多个spark内核，但Cassandra并没有在Hadoop上运行。通过spark(在yarn客户端模式下(从Cassandra获取数据的性能不是很好，从HDFS读取大容量数据的速度更快(在Cassandra中为6分钟，在HDFS中为2分钟(。更改Spark Cassandra参数也没有多大帮助。

在Cassandra之上部署Hadoop会解决这个问题并对读取性能产生重大影响吗？

在不查看代码的情况下，以分析/Spark容量进行的批量读取在直接访问文件VS时总是会更快。从数据库读取。数据库提供了其他优势，如模式强制、可用性、分发控制等，但我认为您看到的性能差异是正常的。

最新更新

使用通配符复制文件 * 为什么它不起作用？
c语言 - 如果我只在以"rb"模式打开的文件的情况下使用它，将 fgetc() 结果转换为 short 是否安全？
增加lambda函数中的值
读取文件夹内的多个docx文件到多个数据帧时出错
为什么servlet显示内部错误500
在getJsonRawBody期间Phalcon 4数据的奇怪符号
c -从optarg中获取int
我如何定义一个CHECK约束来强制一个值的最小3个实例的规则?
React native <View> 在 if 语句中不起作用
以编程方式切换excel中的功能区选项卡
Wordpress & Vue & Nuxt - Integration - wp_enqueue_script
为什么express-mysql-session写入数据库，但不知何故不从它读取?
使用numpy自定义2D矩阵操作
不能分割forloop.django模板中的计数器?
在Python中，仅对列中的某些值将厘米转换为英寸
r语言 - 使用Hugo修复RSS提要中断开的相对链接
我能把一个小块从一页移到另一页吗?
你能帮我一个 sed 命令来搜索一行中的字符串"ABC = 0x000"并执行字符串中零的位置替换吗
如何制作用于从帖子页面访问帖子作者个人资料页面的URL
我已将我的注册详细信息保存在csv文件中，登录时我想验证数据是否有效.但我面对的是错误
我有两个本地仓库，一个在学校，一个在家里，以及github上的远程仓库，我如何从一个本地仓库同步到另一个本地仓库.<
android WebView:复制到剪贴板[https://poe.com]
为什么我的web scraper将所有内容写在一行中?
无法获取…的applicationId项目类型:PROJECT_TYPE_LIBRARY
实例化prefab内部的对象
如何在html文本区的左上角放置按钮?
如何使用Nodejs API获取数据
为什么"需要'原生'"在 opalrb 中抛出异常？
c -结构体中char指针的内存分配
Azure功能应用程序与自托管集成运行时相结合

Cassandra(使用Hadoop)与Spark的性能

相关内容

最新更新

热门标签：