多elimitserde支持null定义为子句



本文表明,我们可以在Hive中使用多字符定界符。

但是我们还可以指定空值吗?

我尝试了以下hive sql返回错误:

CREATE TABLE temp
( a STRING, b STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe'
WITH SERDEPROPERTIES ("field.delim"="@#")
NULL DEFINED AS 'NULL'
STORED AS TEXTFILE;

错误:

Error: Error while compiling statement: FAILED: ParseException line 5:0 missing EOF at 'NULL' near ')' (state=42000,code=40000)

使用 null定义为'null'的选项当我们使用行格式 delimited 选项时可用。在这里,我们使用的是一个行格式SERDE选项,因此我们需要明确传递属性 serialization.null.format

您可以通过设置serialization的属性值来使用以下查询。null.format:

CREATE TABLE temp
( a STRING, b STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe'
WITH SERDEPROPERTIES ("field.delim"="@#",'serialization.null.format'='NULL')
STORED AS TEXTFILE;

有关更多信息,您可以参考Hive DDL参考指南。多elimitserde源代码。

HIVE DDL GUIDE:
row_format
  : DELIMITED [FIELDS TERMINATED BY char [ESCAPED BY char]] [COLLECTION ITEMS TERMINATED BY char]
        [MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]
        [NULL DEFINED AS char]   -- (Note: Available in Hive 0.13 and later)
  | SERDE serde_name [WITH SERDEPROPERTIES (property_name=property_value, property_name=property_value, ...)]

最新更新