Hadoop Cassandra集成设计

我有3 Cassandra nodes让我们说c1,c2 and c3.我想将Hadoop与Cassandra集成，这样我就可以在Hadoop上运行我的pig脚本，从Cassandra读取数据并进行分析。所以我有这样的哈多普设置h1 as name-node , h2 as data-node, c1 as data-node and c3 as data-node. Here h2 node is a only hadoop data-node and not with the any Cassandra node.我在这里的问题是while reading and processing data through pig/mapredude does it uses h2 data-node?

如果我

错了，请纠正我，但是你不需要在所有Cassandra节点上安装Hadoop数据节点吗？我的理解是map-reduce使用HDFS数据节点在减少数据之前存储中间结果。所以我认为很有可能使用H2。这是我的猜测，我期待着更正

相关内容

最新更新

热门标签：