我在SQoop从Oracle导入到Hive
后将其在Hive中获得空排。在sqoop - Query中,我提到了pk并非零。
sqoop查询:
sqoop import
--connect "${SQOOP_CONN_STR}"
--connection-manager "${SQOOP_CONNECTION_MANAGER}"
--username ${SQOOP_USER}
--password ${SQOOP_PASSWORD}
--fields-terminated-by ${SQOOP_DELIM}
--null-string ''
--null-non-string ''
--query ""${SQOOP_QUERY}""
--target-dir "${SQOOP_OP_DIR}"
--split-by ${SQOOP_SPLIT_BY}
-m ${SQOOP_NUM_OF_MAPPERS} 1> ${SQOOP_TEMP_LOG}
是由于字段定界符的变化。
您在HDF中导入,而无需指定任何字段定界符。因此,它将使用默认逗号
您创建的蜂巢表可能具有CTRL^A
(默认(为字段定界符。
使它们同步,它应该起作用。