本文表明,我们可以在Hive中使用多字符定界符。
但是我们还可以指定空值吗?
我尝试了以下hive sql返回错误:
CREATE TABLE temp
( a STRING, b STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe'
WITH SERDEPROPERTIES ("field.delim"="@#")
NULL DEFINED AS 'NULL'
STORED AS TEXTFILE;
错误:
Error: Error while compiling statement: FAILED: ParseException line 5:0 missing EOF at 'NULL' near ')' (state=42000,code=40000)
使用 null定义为'null'的选项当我们使用行格式 delimited 选项时可用。在这里,我们使用的是一个行格式SERDE选项,因此我们需要明确传递属性 serialization.null.format 。
您可以通过设置serialization的属性值来使用以下查询。null.format:
CREATE TABLE temp
( a STRING, b STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe'
WITH SERDEPROPERTIES ("field.delim"="@#",'serialization.null.format'='NULL')
STORED AS TEXTFILE;
有关更多信息,您可以参考Hive DDL参考指南。多elimitserde源代码。
HIVE DDL GUIDE:
row_format
: DELIMITED [FIELDS TERMINATED BY char [ESCAPED BY char]] [COLLECTION ITEMS TERMINATED BY char]
[MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]
[NULL DEFINED AS char] -- (Note: Available in Hive 0.13 and later)
| SERDE serde_name [WITH SERDEPROPERTIES (property_name=property_value, property_name=property_value, ...)]