我是hadoop及其生态系统的新手。Sqoop:从hdfs - RDBMS导入/导出数据。Sqoop兼容JDBC相关数据库。
为什么所有的jdbc代码写在reducer而不是在映射器,而导入和导出数据从/到hdfs - RDBMS ?有人说是为了避免Ddos(分布式拒绝服务)。
Sqoop中没有reducer。Sqoop只需要映射器进行导入和导出。为了将数据从RDBMS导入到Hadoop, Sqoop使用JDBC从数据库获取数据的输入格式。类似地,sqoop具有输出格式,用于在从Hadoop导出数据时将数据写入RDBMS