将 Hive 表导出为 hdfs 中的 csv/tsv



>我使用以下代码将表从 hive 导出到 csv/tsv 格式的 hdfs。

INSERT OVERWRITE DIRECTORY '/user/xyz/dem_data/science_data'
ROW FORMAT DELIMITED FIELDS TERMINATED BY 't' LINES TERMINATED BY 'n'
STORED AS TEXTFILE
SELECT *
FROM science_data;

当我在hdfs中查看复制的文件时,我看到很多这样的字符

??=%??0nother episod?/aAj%?is   ?a???$of J horse!de9?amA?se0(

我不确定出了什么问题。 我是否需要对此进行某种编码才能获得干净的文本。实际文件具有干净的文本。

请尝试使用下面给出的命令使用本地目录:

INSERT OVERWRITE LOCAL DIRECTORY '/home/cloudera/Desktop/xyz/science_data' ROW FORMAT DELIMITED FIELDS TERMINATED BY 't' STORED AS TEXTFILE select * from table_name;

最新更新