输入empmname |logintime|logofftime
湿婆|9.30|10.30
普拉萨德|9.35|9.55
湿婆|10.40|11.45
湿婆|11.55|12.30
湿婆|1.40|2.45
湿婆|3.40|4.45
普拉萨德|10.10|10.55
普拉萨德|11.35|12.05
普拉萨德|12.45|1.45
普拉萨德|2.35|4.45
普拉萨德|5.35|6.10
拉维|9.00|9.55
拉维|10.00|11.50
拉维|1.05|1.20
拉维|5.00|5.55
要求:
MapReduce程序找出哪个用户停留的时间更多。
这似乎是考试或其他问题,我不会告诉你代码,但逻辑应该是这样的:
-
获取 String 中的数据,在 '|' 的基础上拆分,得到开始和结束时间的差值,并将其发送到化简器
-
在减速器上,添加单个员工对应的所有"时间">
就这么简单。
顺便说一句,如果你想在Hadoop上取得成功,你应该学会这样思考。