我在亚马逊EC2的Linux RHEL 7.2实例中安装了Cloudera 5.8。我已经用SSH登录,我正在尝试运行wordcount示例,以使用以下命令测试mapreduce操作:
hadoop jar /opt/cloudera/parcels/CDH-5.8.0-1.cdh5.8.0.p0.42/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar wordcount archivo.txt output
问题是wordcount程序被阻塞了,它没有产生输出。只提示以下内容:
16/08/11 13:10:02 INFO client.RMProxy: Connecting to ResourceManager at ip-172-31-22-226.ec2.internal/172.31.22.226:8032
16/08/11 13:10:03 INFO input.FileInputFormat: Total input paths to process : 1
16/08/11 13:10:03 INFO mapreduce.JobSubmitter: number of splits:1
16/08/11 13:10:04 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1470929244097_0007
16/08/11 13:10:04 INFO impl.YarnClientImpl: Submitted application application_1470929244097_0007
16/08/11 13:10:04 INFO mapreduce.Job: The url to track the job: http://ip-172-31-22-226.ec2.internal:8088/proxy/application_1470929244097_0007/
16/08/11 13:10:04 INFO mapreduce.Job: Running job: job_1470929244097_0007
然后被阻塞,因为"Running job"。在此之后,我必须按Ctrl+C来取消阻塞,它不会产生输出。
有人知道为什么吗?我认为这可能是一个配置问题,我是新的datanode等。
看起来没有资源(map或reducer插槽),作业正在等待资源。您可以查看作业状态。
http://ip-172-31-22-226.ec2.internal:8088