Hadoop Cassandra集成设计



我有3 Cassandra nodes让我们说c1,c2 and c3.我想将Hadoop与Cassandra集成,这样我就可以在Hadoop上运行我的pig脚本,从Cassandra读取数据并进行分析。所以我有这样的哈多普设置h1 as name-node , h2 as data-node, c1 as data-node and c3 as data-node. Here h2 node is a only hadoop data-node and not with the any Cassandra node.我在这里的问题是while reading and processing data through pig/mapredude does it uses h2 data-node?

如果我

错了,请纠正我,但是你不需要在所有Cassandra节点上安装Hadoop数据节点吗?我的理解是map-reduce使用HDFS数据节点在减少数据之前存储中间结果。所以我认为很有可能使用H2。这是我的猜测,我期待着更正

最新更新