MapReduce用例为员工开始和结束时间找出哪个员工满足更多时间



输入empmname |logintime|logofftime

湿婆|9.30|10.30

普拉萨德|9.35|9.55

湿婆|10.40|11.45

湿婆|11.55|12.30

湿婆|1.40|2.45

湿婆|3.40|4.45

普拉萨德|10.10|10.55

普拉萨德|11.35|12.05

普拉萨德|12.45|1.45

普拉萨德|2.35|4.45

普拉萨德|5.35|6.10

拉维|9.00|9.55

拉维|10.00|11.50

拉维|1.05|1.20

拉维|5.00|5.55

要求:

MapReduce程序找出哪个用户停留的时间更多。

这似乎是考试或其他问题,我不会告诉你代码,但逻辑应该是这样的:

  1. 获取 String 中的数据,在 '|' 的基础上拆分,得到开始和结束时间的差值,并将其发送到化简器

  2. 在减速器上,添加单个员工对应的所有"时间">

就这么简单。

顺便说一句,如果你想

在Hadoop上取得成功,你应该学会这样思考。

最新更新