如何从DFS中删除hadoop节点,而不是从Mapred



我对hadoop相当陌生。为了运行一些基准测试,我需要各种hadoop配置进行比较。

我想知道一种方法,从DFS(不再运行datanode守护进程),但不是从Mapred(保持运行tasktracker),反之亦然。我敢说,这样的hadoop节点有一个单独的从文件,而不是单独的DFS和Mapred的从文件。

当前,我正在尝试在从节点上同时启动DFS和Mapred,然后在从节点上杀死datanode。但是将该节点放入HDFS GUI上的"死节点"需要一段时间。任何参数都可以调优以使此超时更快?

Thankssss

尝试使用dfs。Hosts和dfs.hosts.exclude在hdfs-site.xml中映射。mapred-site.xml中的Hosts和mapred.hosts.exclude。这些是用于允许/排除主机连接到NameNode和JobTracker。

一旦文件中的节点列表被适当更新,NameNode和JobTracker必须分别使用hadoop dfsadmin -refreshNodeshadoop mradmin -refreshNodes命令刷新。

如果您有几个节点,您可以只在每台机器上启动所需的守护进程,而不是使用slaves文件来启动集群上的所有进程。

相关内容

  • 没有找到相关文章

最新更新