只是想了解节点标签在HDFS方面是如何工作的。我了解使用在节点标签下定义的有限节点集的纱线进行加工。如何在 HDFS 级别对其进行管理?假设我有 40 个节点,并为节点标签分配 20 个节点。
- 数据是否会从一个节点复制到另一个节点进行处理?
- 数据是否仅驻留在节点标签下的那些节点中。
努力获取有关上述主题的材料。
好吧,节点标签仅用于 YARN 处理。数据处理可能在本地提供数据,也可能不提供数据。在这种情况下,数据将从另一个节点流式传输。处理时间将受到影响。根据用例,标签可能有用,也可能没有用。