Hadoop python作业在使用echo的代码完美运行时给了我一个错误



我正在尝试找到校园里最受欢迎的人的斯坦福大学CS246 2014 hw解决方案的解决方案。

我一直遇到错误"错误:java.lang.RuntimeException:PipeMapRed.waitOutputThreads():子进程失败,代码 1"

我的映射器的 python 代码是

{#!/usr/bin/python
import sys
ID = None
fcount = 0
count = 0
for line in sys.stdin:
    line = line.strip()
    words = line.split("        ")
    ID,friends = words
    fcount = len(friends.split(","))
    #count = fcount * -1
#for i in friends:
#               if i != ','
#               fcount +=1
    print "%dt%s" %(fcount,ID)
}

我的减速器代码是

{

#!/usr/bin/python
import sys
ID = None
fcount = 0
count = 0
for line in sys.stdin:
    line = line.strip()
    words = line.split("        ")
    ID,friends = words
    fcount = len(friends.split(","))
    #count = fcount * -1
#for i in friends:
#               if i != ','
#               fcount +=1
    print "%dt%s" %(fcount,ID)

}

任何帮助将不胜感激

终于想通了。发生错误是由于两个不同版本的 python。我的系统上有python 3,hadoop系统上有python 2。

相关内容

  • 没有找到相关文章

最新更新