配置 cassandra 以使用不同的网络接口进行数据流和客户端连接



我部署了一个 cassandra 集群,其中包含 3 个复制因子为 3 的 cassandra 节点。我每天都有很多数据写入Cassandra(10-15GB)。我已经按照"大数据社区"的建议在商品硬件上配置了这些 cassandra,我预计节点会频繁关闭,这是使用 cassandra 提供的冗余来处理的。

我的问题是,我观察到 cassandra 在配置新节点并在引导时流式传输数据时会减慢写入速度。因此,为了克服这个障碍,我们决定有一个单独的网络接口,用于节点间通信和客户端应用程序将数据写入 cassandra。我的问题是,如果这可能的话,如何配置?

任何帮助,不胜感激。

我认为你正在追逐错误的解决方案。

我对你只有 3 个节点的事实感到困惑,但你关心的是引导时写入速度慢。为什么?您是否计划定期扩展集群?写入时的一致性级别是多少,因为这对性能有很大影响?显然,如果您只有 2 或 3 个节点并且您正在尝试引导,您将看到速度变慢,因为您占用了很大一部分集群来进行流式传输。

请注意,"商用硬件"并不意味着廉价、低性能的硬件。 这只是意味着您不需要像Oracle这样的用于数据库的超高端数据库级机器。 您仍然应该使用非常好的商品硬件。 您可能还需要更多节点,因为将 RF 设置为等于集群大小通常不是一个好主意。

话虽如此,如果您觉得有帮助,您可以将listen_address设置为节点间接口,rpc_address客户端地址。

最新更新