在Docker容器上使用Hadoop和Spark



我想为我的工作使用大数据分析。我已经实施了所有Docker的东西在容器中创建容器。但是,我是大数据的新手,我已经知道,在Hadoop上使用Hadoop用于HDFS,而不是在Hadoop上使用Spark而不是MapReduce,这是速度重要的网站和应用程序的最佳方法(这是吗?)。这可以在我的Docker容器上使用吗?如果有人可以将我引导在某个地方学习更多信息,这将非常有帮助。

您可以尝试使用Cloudera QuickStart Docker Image开始播放。请看一下https://hub.docker.com/r/cloudera/quickstart/。此Docker映像支持Cloudera Hadoop平台和Cloudera Manager的单节点部署。此码头图像也支持火花。

相关内容

  • 没有找到相关文章

最新更新