我正在处理Presto数据库中的一些课程数据。表中的数据看起来像:
student_id period score completed
1 2016_Q1 3 Y
1 2016_Q3 4 Y
3 2017_Q1 4 Y
4 2018_Q1 2 N
我想格式化数据,使其看起来像:
student_id 2018_Q1_score 2018_Q1_completed 2017_Q3_score
1 0 N 5
3 4 Y 4
4 2 N 2
我知道我可以通过加入每个时间段的表来做到这一点,但我想在这里询问一下,看看是否有专家建议使用更具可扩展性的解决方案(例如,也许不必为每个时间段手动创建新的加入(。有什么建议吗?
您可以使用条件聚合:
select student_id,
max(case when period = '2018_Q1' then score else 0 end) as score_2018q1,
max(case when period = '2018_Q1' then completed then 'N' end) as completed_2018q1,
max(case when period = '2017_Q3' then score else 0 end) as score_2017q3
from t
group by student_id