MapReduce Amazon Python 获取输入文件的行 umber



>我有几个文本,我想知道行号和出现单词的文件。

我得到了文件,但没有获得行号。

这是地图

#!/usr/bin/env python
import sys
import os
find = 'but' #word to find
linesCont = 0
file = os.environ["map_input_file"]
for line in sys.stdin:
    line = line.strip()
    words = line.split()
    linesCont = linesCont + 1;  
    for word in words:
        if (word in (find)):        
            print '%st%s' % (file, linesCont)

它是减少

#!/usr/bin/env python
import sys
result = {}
for line in sys.stdin:
    line = line.strip()
    file, lineNumber = line.split('t', 1)
    try:
        result[file] = result[file] + ', ' + lineNumber
    except:
        result[file] = 'File "%s". LineNumber(s): %s' % (file, lineNumber)
for file in result.keys():
    print '%st' % (result[file])

提前非常感谢

这是Apache论坛中关于同一问题的讨论。SO 中的另一个查询。这是一个代码片段,用于获取正在处理的块的文件名。

相关内容

  • 没有找到相关文章

最新更新