我有一个有四列的表。
C1 C2 C3 C4
--------------------
x1 y1 z1 d1
x2 y2 z2 d2
现在我想将它转换为具有键和值对的映射数据类型,并加载到单独的表中。
create table test
(
level map<string,string>
)
row format delimited
COLLECTION ITEMS TERMINATED BY '&'
map keys terminated by '=';
现在我使用下面的sql来加载数据。
insert overwrite table test
select str_to_map(concat('level1=',c1,'&','level2=',c2,'&','level3=',c3,'&','level4=',c4) from input;
在表中选择查询。
select * from test;
{"level1":"x1","level2":"y1","level3":"z1","level4":"d1=\"}
{"level1":"x2","level2":"y2","level3":"z2","level4":"d2=\"}
我不明白为什么我在最后一个值中得到额外的"=\\"。
我仔细检查了数据,但问题仍然存在。
你能帮忙吗?
str_to_map(text, delimiter1, delimiter2)
-通过解析文本创建映射使用两个分隔符将文本拆分为键值对。第一个分隔符用于分隔对,第二个分隔符则用于分隔键和值。如果只给定一个参数,则使用默认分隔符:','
作为delimiter1
,'='
作为delimiter2
。
你可以通过运行以下命令来获得这些信息:
describe function extended str_to_map
在您的语法中有两个错误:
insert overwrite table test
select str_to_map(concat('level1=',c1,'&','level2=',c2,'&','level3=',c3,'&','level4=',c4) from input;
首先,缺少一个括号()。
第二,这基本上不是一个错误,你没有给出分隔符,所以函数为分隔符取默认值,这就是为什么你的结果中会出现','。
要获得当前格式的输出,您应该尝试以下查询:
insert overwrite table test
select str_to_map(concat('level1=',c1,'&','level2=',c2,'&','level3=',c3,'&','level4=',c4),'&','=') from input;