H2O.ai 在几张幻灯片和文档中提到 H2O.ai 可以在SQL上运行。如何将我的 H2O.ai 实例连接到 SQL 服务器?到目前为止,我能找到的唯一建议看起来相当令人失望:https://groups.google.com/forum/#!topic/h2ostream/x8BLSGbyvhA
有没有更优雅的方式来直接连接到SQL Server?
H2O 还没有本机 JDBC 连接器。
你可以在Spark w/Sparkling Water中利用H2O的算法(https://github.com/h2oai/sparkling-water):使用Spark SQL将数据摄取到RDD中,将其转换为H2OFrame(你可以在任一方向上转换),并将其传递给H2O的算法。
一种更直截了当的方法是将数据查询到 CSV 中,然后 H2O 可以读取。如果您的数据大小不是太大,这可能是合理的。