如标题所述,我想知道雪花支持哪些数据源。我甚至不完全确定如何处理这个问题。我知道您可以在受支持的云提供商的云存储中创建外部舞台,但是如果我想从Oracle数据库加载数据,该怎么办呢?在这种情况下,最好的解决方案是使用ODBC驱动程序,还是?
请随时给我任何建议,或建议在哪里继续我的研究。此外,如果我的问题有不清楚的地方,请让我知道,以便我可以重新措辞:)
Snowflake原生支持AVRo, Parquet, CSV, JSON和ORC。这些被放置在一个阶段中以供摄取——您所选择的ELT/ETL工具,甚至是自己构建的应用程序必须将数据放置在一个阶段中,要么是内部的,要么是外部的。然后,使用由上述工具自动执行的COPY命令或使用Snowpipe之类的工具将该文件摄取到Snowflake中。我们有关于Firehose/Kafka管道着陆数据的文档,可以通过AUTO_INGEST通知(仅限于外部阶段)或调用我们的REST API来为Snowpipe摄取。
所有支持我们的文档,只需谷歌我提到的术语,将有大量的文档
多个现有的ETL工具允许将Snowflake定义为目标,支持各种各样的源。
本地可编程接口
雪花生态系统-数据集成