分组后如何将猪压平并得到如下所示的预期产量

  • 本文关键字: hadoop bigdata apache-pig etl flatten
  • 更新时间 :
  • 英文 :

样本日期:

ID标记日期

12345 12 20210204

12345 13 20210204

12345 2 20210204

输入:

(12345年,{(12345,12,20210204),(20210204)12345年,13日,(12345,20210204)})

输出需要:27岁的

(12345 20210204)

第二个元素是聚合值。

感谢帮助

output = FOREACH input GENERATE
group AS ID,
SUM(sample.marks) AS mark_sum,
MIN(sample.date) AS first_date;

您可能需要根据您的关系名和字段名进行调整。如果这些都是相同的,您可能也想按日期字段分组。

相关内容

  • 没有找到相关文章

最新更新