样本日期:
ID标记日期
12345 12 20210204
12345 13 20210204
12345 2 20210204
输入:
(12345年,{(12345,12,20210204),(20210204)12345年,13日,(12345,20210204)})
输出需要:27岁的
(12345 20210204)
第二个元素是聚合值。
感谢帮助
output = FOREACH input GENERATE
group AS ID,
SUM(sample.marks) AS mark_sum,
MIN(sample.date) AS first_date;
您可能需要根据您的关系名和字段名进行调整。如果这些都是相同的,您可能也想按日期字段分组。