我正试图使用HiveQL在Amazon EMR上运行一个查询。表格结构如下:
parentId INT,阵列:STRUCT:childId:INT,类别:INT
我想能够按照parentId和childId的组合进行分组,我该怎么做?是否需要将表导出到另一个表,以便每个parentId和childId都成为自己的行?或者有更好的方法吗?
提前感谢!
Figured this out:
<pre>
SELECT parentId, array_items.childId , array_items.category
FROM table LATERAL VIEW explode(array) exploded_table as array_items;
</pre>
does the trick. Thanks @libjack