有人能给我提供一些尚未在Apache Spark中实现的Java API示例吗。如果我决定使用Java API,我想看看是否有任何Scala Spark API"不存在/功能有限"。这对我来说将是一个交易破坏者。
免责声明:根据我的谷歌搜索/分析,我意识到Scala社区对ApacheSpark的支持非常好。我还知道,为了有效地使用Spark,你无论如何都需要学习一些Scala(因为源代码在Scala中)。
乐观主义观点:
考虑一下:
Scala的标准后端是一个Java虚拟机。Scala类是Java类,反之亦然。您可以从另一种语言中的方法调用其中一种语言的方法。您可以在Scala中扩展Java类,反之亦然。主要的限制是Scala的一些特性在Java中没有等价的特性,例如traits。
结论-API 无缺失
悲观的观点:
Spark是用Scala编写的,带有以Scala为中心的API,不支持Java。有多个包(如GraphX)没有Java友好的API。你偶尔需要这样的代码。