我看到了mapreduce作业的替代品,MapR,它可以直接从流中读取数据并处理它。我的理解正确吗?
- 有没有我可以参考的样品?
- 是商业的吗?
- 使用它有什么问题吗?
- 它是水槽的替代品吗?
- 我们可以在apache hadoop中使用它吗?如果是,那么为什么发行版只谈论纱线和mapreduce而不是MapR?
提前谢谢。
MapR
是Apache Hadoop的商业发行版,HDFS被MapR-FS取代。从本质上讲,它是相同的Hadoop和相同的Map-Reduce工作,上面运行着大量的营销,导致像你这样的混乱和问题。以下是它们分布中的组件图: https://www.mapr.com/products/mapr-distribution-including-apache-hadoop
- 对于MapR之上的流处理,您可以使用Apache Spark Streaming,Apache Flume,Apache Storm - 这取决于您需要解决的任务 是的,
- 据我所知,它是商业的,基于每个节点的许可。您可以轻松联系他们的销售人员,他们很乐意解释价格和条款
- 就像其他Hadoop发行版一样,但就我个人而言,我更喜欢完全开源的平台而不是专有的MapR-FS,但这取决于您的选择
- 不
- 因为Apache Hadoop是许多商业发行版的一部分:Cloudera,MapR,Hortonworks,Pivotal等。当你读到Hadoop时,你读的是系统架构,而不是为企业提供支持的商业软件包。