我使用的是Amazon Athena,我有一个大数据集。我想在同一个表中加入的数据出现在不同的列中,但它们具有相同的ID和帐户名。以下示例:
Sub_ID Account Name Contract_Length Cost
1 Canary 3 years
2 Mockjay 3 years
3 Pidgeon 2 years
1 Canary 50.45
2 Mockjay 96.5
3 Pidgeon 112.21
我想要它的样子:
Sub_ID Account Name Contract_Length Cost
1 Canary 3 years 50.45
2 Mockjay 3 years 96.5
3 Pidgeon 2 years 112.21
在SQL Presto中,如何在1个表和2个公共列(ID和帐户名(中做到这一点?
只需使用聚合:
select sub_id, account_name, max(contract_length), max(cost)
from t
group by sub_id, account_name;
也就是说,您可能可以修复生成问题中结果集的代码。出现这种情况时,通常是由于格式错误的聚合查询造成的。