我已经听说有类型的簇:单节点,伪分布式和多键。我想知道它们之间存在明显的差异。我是这个领域的新手。所以请清楚地解释。
这些是hadoop群集的组成部分:
- 名称节点:保留元数据
- 任务跟踪器:接受任务
- 工作跟踪器:耕种地图减少任务
- 数据节点:Holda Data
- 辅助名称节点:Namenode的托管编辑日志。不要让这个名字欺骗您,而不是备份/故障转移。
在单节模式中:所有组件都位于单个计算机上
在中,多节点模式:所有组件均分布在几台计算机上。
在中,伪分布式模式:在本地计算机上运行的组件,该机器模拟一个小群集。仍然使用HDFS代替本地文件系统