这个关键字 Context in Hadoop MapReduce 世界中的新 API 术语中到底是什么?
它广泛用于从 Maps 和 Reduce 中写入输出对,但我不确定它是否可以在其他地方使用,以及每当我使用上下文时到底发生了什么。它是具有不同名称的迭代器吗?
ClassMapper.Context、Class Reducer.Context 和 Job.Context 之间的关系是什么?
有人可以解释一下,从外行的条款开始,然后详细介绍。无法从Hadoop API文档中理解太多内容。
感谢您的时间和帮助。
上下文对象:允许映射器/化简器与Hadoop系统的其余部分进行交互。它包括作业的配置数据以及允许它发出输出的接口。
应用程序可以使用上下文:
- 报告进度
- 设置应用程序级状态消息
- 更新计数器
- 表明他们还活着
- 以获取跨映射/减少阶段存储在作业配置中的值。
新的API广泛使用了Context对象,允许用户代码与MapRduce系统进行通信。
它统一了旧 API 中的 JobConf、OutputCollector 和 Reporter 的角色。