我的pig语句生成以下输出:
({(10)},5201)
({(20),(20),(20)},3334)
({(30),(30),(30),(30)},4632)
({(40),(40)},3101)
({(50),(50)},3801)
({(60),(60),(60)},3959)
但我想将以上输出存储在清管器中,如下所示:
(10,5201)
(20,3334)
(30,4632)
(40,3101)
(50,3801)
(60,3959)
有没有办法从猪的袋子里提取第一个元素?
使用Datafu UDF FirstTupleFromBag来实现这一点!