Spark Controller 和 SAP Vora 之间的区别



我有一个版本为2 SP 01的HANA Express Server和一个装有Hortonworks Data Platform 2.6的Hadoop Cluster。在Hadoop集群上,我安装了Vora 1.4和SparkController 2.1.1。

我看到了以下视频,其中解释了从一个 HANA 版本到另一个版本的更改:https://www.youtube.com/watch?v=-B9LUjt8x2s&list=PLkzo92owKnVxweu0HK_3QjCfHiMn0jIcA%E2%88%88dex=66

在SPS 10中,Spark控制器似乎是HANA/Hadoop交互的实际连接器。

但是,Vora是连接Hadoop和HANA的实际标准解决方案,而我的环境中不再需要Spark控制器吗?或者Spark控制器对Vora有一些其他优势/功能?

Jason Hinsperger 对我在 HANA 社区中的另一个问题的回答(https://answers.sap.com/questions/252517/difference-between-spark-controller-and-sap-vora.html(:

仅当您从 Hana 连接到 Hadoop 并且不使用 SAP Vora 时,才需要 Spark 控制器。

SAP Vora是数据湖的独立分布式内存分析层,其功能之一是它提供对Hana的高性能双向访问(例如,您可以通过Vora从Hana查询Hadoop数据,也可以从Hadoop上运行的Vora查询Hana数据(。Vora还有许多其他与分析数据湖有关的好处(增强的功能,性能,建模,特定于数据的查询引擎等(,这些好处在文档和各种营销材料中都有介绍。

呵呵,

--杰森

最新更新