Cassandra集成hadoop的读性能



我使用Apache Cassandra存储大约1亿条记录。有一个具有以下规格的单个节点-

RAM-32GB, HDD-2TB, Intel quad core processor.

cassandra有一个读性能问题。对于某些查询,输出大约需要40分钟。在搜索如何提高读性能后,我了解到以下因素-

Compaction strategy,compression techniques, key cache, increase the heap space, turning off the swap space for cassandra.

在做了这些优化之后,性能保持不变。在搜索之后,我开始考虑将Hadoop与cassandra集成。这是正确的方式做查询在卡桑德拉或任何其他因素,我在这里错过了吗?谢谢。

看起来您的数据模型可以改进。40分钟是不可能的。我在几分钟内下载了600万条记录(约10gb)的所有数据。因为我在下载和存储的过程中转换了数据。琐碎的选择必须花费几毫秒。

您是否基于必须执行的查询来构建它?

最新更新