现在我正在实现apache hive,我现在该hive运行的mapreduce算法也像通常的hadoop mapreduce。所以,我想知道,关于从一个配置单元查询中得到的关于mapreduce、mapper和reducer的解释。那个查询怎么能做一个mapreduce?
谢谢大家。。。。。
类似于Oracle或MySQL在这些数据库中运行SQL查询时对SQL所做的操作。有一个解析器,它解析查询,然后构建出数据库引擎能够理解的特定于Oracle/MySQL的指令。类似地,Hive有一个解析器&将SQL查询转换为MR 的优化器
例如,从table_name中选择count(*);将转换为Mapper(读取文件和计数)-->Reducer(求和所有计数并返回)。