在Pig中加载文件,并用分隔符将其转换为一行



我需要你的帮助,请输出我在Pig中加载的文件,其中包含这样的数据:

AAAA,message1
BBBB,message2
CCCC,message3
DDDD,message4

我需要做的是得到一个像这样的输出

AAAA,message1,BBBB,message2,CCCC,message3,DDDD,message4

这个输出我将在..之后在其他pig udf中使用它。。

感谢您的帮助

输入:

AAAA,message1
BBBB,message2
CCCC,message3
DDDD,message4

Pig脚本:

A = LOAD 'input.csv'  USING  PigStorage(',') AS (key:chararray,value:chararray);
B = GROUP A ALL;
C = FOREACH B {
    D = ORDER A BY key;
    GENERATE BagToString(D,',');
    }; 
DUMP C;

输出:

(AAAA,message1,BBBB,message2,CCCC,message3,DDDD,message4)

最新更新