如何从sqoop导入(oracle到hive)停止nulls



我在SQoop从Oracle导入到Hive

后将其在Hive中获得空排。

在sqoop - Query中,我提到了pk并非零。

sqoop查询:

sqoop import 
--connect "${SQOOP_CONN_STR}" 
--connection-manager "${SQOOP_CONNECTION_MANAGER}" 
--username ${SQOOP_USER} 
--password ${SQOOP_PASSWORD} 
--fields-terminated-by ${SQOOP_DELIM} 
--null-string '' 
--null-non-string '' 
--query ""${SQOOP_QUERY}"" 
--target-dir "${SQOOP_OP_DIR}" 
--split-by ${SQOOP_SPLIT_BY} 
-m ${SQOOP_NUM_OF_MAPPERS} 1> ${SQOOP_TEMP_LOG} 

是由于字段定界符的变化。

您在HDF中导入,而无需指定任何字段定界符。因此,它将使用默认逗号

您创建的蜂巢表可能具有CTRL^A (默认(为字段定界符。

使它们同步,它应该起作用。

最新更新