嗨,我在Oracle和SQL Server中有表。我需要使用 Spring XD 将数据从 oracle 和 sql server 加载到 Pivotal HAWQ 中。在文档中找不到。
您需要将 sqoop 作业与 Spring XD 集成。请参阅下面的链接,了解使用 springxd 的 sqoop 作业
https://github.com/tzolov/spring-xd-sqoop-job
您可以使用 jdbchdfs 作业以 CSV 或任何 PXF 支持的格式加载 HDFS 中的数据。然后,您可以使用 PXF 外部表支持将加载的数据映射到 HAWQ 表。如果需要将此数据加载到本机 HAWQ 表,则可以从那里执行"选择插入",或者将"选择插入"配置为另一个批处理作业,将数据从 PXF 外部表加载到 HAWQ 本机。
Outsourcer是另一个开源解决方案,最初设计用于将数据从Oracle和SQL Server加载到Greenplum中,但前段时间进行了增强以支持HAWQ。
所有文档和下载都在 http://www.pivotalguru.com/
如果您有兴趣查看源代码,这里是:https://github.com/pivotalguru/outsourcer