如何从猪的袋子中提取单个元素



我的pig语句生成以下输出:

({(10)},5201)
({(20),(20),(20)},3334)
({(30),(30),(30),(30)},4632)
({(40),(40)},3101)
({(50),(50)},3801)
({(60),(60),(60)},3959)

但我想将以上输出存储在清管器中,如下所示:

(10,5201)
(20,3334)
(30,4632)
(40,3101)
(50,3801)
(60,3959)

有没有办法从猪的袋子里提取第一个元素?

使用Datafu UDF FirstTupleFromBag来实现这一点!

最新更新