目前,我解决了这个主题的最初问题:Hadoop/Hive-将一行拆分为多行并存储到一个新表中。
有人知道如何用分组的子表创建一个新表吗?
ID Subs
1 deep-learning, machine-learning, python
2 java, c++, python, javascript
使用下面的代码,我得到了我想要的返回,但不知道如何将输出保存到新的表中
use demoDB
Select id_main , topic_tag from demoTable
lateral view explode (split(topic_tag , ',')) topic_tag as topic
谢谢尼科
在Hive中,您可以使用create ... as select ...
:
create table newtable as
select id_main, topic_tag
from demoTable
lateral view explode (split(topic_tag , ',')) topic_tag as topic
这将创建一个新表,并从查询的结果集中启动其内容。如果新表已经存在,则使用insert ... select
:
insert into newtable (id_main, topic_tag)
select id_main, topic_tag
from demoTable
lateral view explode (split(topic_tag , ',')) topic_tag as topic