Datastax Hadoop节点基础知识



我正在尝试在我的datastax企业集群中设置一些hadoop节点以及一些cassandra节点。在这一点上,我不清楚两件事。第一,我需要多少个Hadoop节点?是相同数量的Cassandra节点吗?数据是否仍然存在于Cassandra节点上?其次,教程提到我应该在Hadoop节点上禁用虚拟节点。我是否仍可以在该群集中的 cassandra 节点上使用虚拟节点?谢谢。

在Datastax Enterprise中,您可以在也运行Cassandra的节点上运行Hadoop。最常见的部署是创建两个数据中心(节点的逻辑分组)。一个数据中心专门用于分析,包含同时运行 Hadoop 和 C* 的计算机,另一个数据中心仅是 C*,为群集的 OLTP 功能提供服务。Analytics 节点上的 C* 进程连接到群集的其余部分(与任何其他 C* 节点一样),并在写入突变时接收更新,因此它最终与数据库的其余部分保持一致。数据既位于这些节点上,也位于群集中的其他节点上。同样,大多数人最终都会使用 NetworkTopologyStrategy 进行复制模式,该模式在其仅 C* DC 中指定多个副本,在其分析 DC 中指定单个副本,但您的用例可能有所不同。两个数据中心中的节点数不必相等。

对于第二个问题,是的,您可以在仅限 C* 的数据中心启用虚拟节点。此外,如果批处理作业的大小足够大,则还可以在分析数据中心中运行虚拟节点,而性能只会受到轻微影响。同样,这完全基于您的用例。如果您想要许多更快的较短的分析作业,则不希望在 Analytics 数据中心启用虚拟节点。

相关内容

  • 没有找到相关文章

最新更新