配置单元-如何通过主列和数组中的子列的组合进行分组



我正试图使用HiveQL在Amazon EMR上运行一个查询。表格结构如下:

parentId INT,阵列:STRUCT:childId:INT,类别:INT

我想能够按照parentId和childId的组合进行分组,我该怎么做?是否需要将表导出到另一个表,以便每个parentId和childId都成为自己的行?或者有更好的方法吗?

提前感谢!

Figured this out: 
<pre>
    SELECT parentId, array_items.childId , array_items.category 
    FROM table LATERAL VIEW explode(array) exploded_table as array_items;
</pre>
does the trick. Thanks @libjack

相关内容

  • 没有找到相关文章

最新更新