主节点在数据节点上运行是否正确?



我使用的是用纱线型材构建的giraph-1.3。首先,我在 ec2 集群上配置了 1 个名称节点和 2 个数据节点。 我的应用程序正常工作,因为我在日志(和输出目录中(看到了预期的输出。我用"-w 2"参数启动了giraph,因为我有两个数据节点。

在datanode1的用户日志中,我找到了第一个工作线程的日志。
在 datanode2 的用户日志中,我也找到了第二个工人的日志和主服务器的日志。

我希望在名称节点中找到主节点的日志,即我希望主节点在名称节点上运行。对吗?

也许我必须配置另一个数据节点,然后我会在这个新数据节点上找到主日志?

我知道hadoop/giraph可以在数据节点上创建容器。Hadoop 为应用程序主节点创建一个容器,然后 giraph 为主节点创建一个容器。此外,giraph为对应于-w参数的工作线程创建了许多容器。

YARN 始终为每个作业创建一个应用程序主节点。

您可以根据需要启动任意数量的"worker",具体取决于您的工作负载,但由于您只有 2 个数据节点,因此您只能有 2 个 NodeManager 以实现最大的并行性

NodeManager 具有最大可用内存空间,并且用于作业任务的 YARN 容器获取该子部分以执行处理。

最新更新