在Google应用引擎上运行hadoop



是否可以在谷歌应用程序引擎上运行地图减少作业?

任何参考或教程都会有帮助

谢谢

Sort of。

你不能使用实际的MapReduce框架——架构与AppEngine太不兼容了。

然而,有一个专门为GAE - appengine-mapreduce构建的等效系统。这个站点有点令人困惑,因为代码的第一个版本只支持mapreduce,没有后续的reduce步骤——最近他们发布了一个完全支持mapreduce的版本,但是一些文档仍然引用了早期的mapreduce -only。

最好的介绍是Mike Aizatskyi的GoogleIO演讲。

你不能在Appengine上运行Hadoop(也不能访问文件系统)。

您可能需要检查AWS ElasticMapreduce。它是一个运行Mapreduce作业的基于云的平台。

ElasticMapreduce

完整的文档如下:https://developers.google.com/appengine/docs/python/dataprocessing/overview

看到这个Google Cloud Platform广告:
Hadoop on Google Compute Engine虚拟机
https://cloud.google.com/solutions/hadoop

相关内容

  • 没有找到相关文章

最新更新