Hadoop 地图减少作业挂起时间过长



我有一个关于运行hadoopmapreduce作业的问题。我有一个桌子工作人员,按加入日期划分。创建如下语句:

创建按(join_date字符串)行格式分隔字段分区的表工作人员(ID int,年龄整数),以"\;"结尾;

我将一些数据放入 parition '20130921' 然后当我执行下面的语句时,结果还可以:

select count(*) from staff where join_date='20130921';**

但是当我在分区"20130922"(没有数据的分区)上执行时,map reduce 作业挂起的时间太长,似乎永远运行:

hive> select count(*) from staff where join_date='20130922';**
Total MapReduce jobs = 1**
Launching Job 1 out of 1**
**Number of reduce tasks determined at compile time: 1**
**In order to change the average load for a reducer (in bytes):**
    set hive.exec.reducers.bytes.per.reducer=<number>**
**In order to limit the maximum number of reducers:**
    set hive.exec.reducers.max=<number>**
**In order to set a constant number of reducers:**
    set mapred.reduce.tasks=<number>**
**Starting Job** = `job_201309231116_0131, Tracking URL = ....jobid=job_201309231116_0131`
**Kill Command** = `/u01/hadoop-0.20.203.0/bin/../bin/hadoop job  -kill job_201309231116_0131`
Hadoop job information for Stage-1: number of mappers: 0; number of reducers: 1
2013-09-23 17:19:07,182 Stage-1 map = 0%,  reduce = 0%
2013-09-23 17:19:07,182 Stage-1 map = 0%,  reduce = 0%
2013-09-23 17:19:07,182 Stage-1 map = 0%,  reduce = 0%
作业

跟踪器显示减少待处理任务,此作业似乎无法完成。

我使用 hadoop-0.20.203.0 和 hive-0.10.0。我用谷歌搜索了一整天,但没有发现任何主题有同样的问题,请帮助我。

此致敬意。

这似乎是您的 Hive 安装的问题。我遇到了类似的问题。可以尝试重新启动 Hive Server 和 Hive Metastore。这解决了我的问题。

相关内容

  • 没有找到相关文章

最新更新