使用Hadoop、Apache Spark、HBase实现lambda架构

我想用一个简单的例子实现lambda架构。我无法将我的技术堆栈应用到lambda架构的每一层。

我想实时找出推特上最受欢迎的10个标签。我从http://lambda-architecture.net/中列出了每个层的用途。

我可以用每一层解决问题的哪一部分。我正在与Apache Spark工作;Hadoop HDFS技术栈

我相信这个链接会对你有帮助。

http://blog.cloudera.com/blog/2012/09/analyzing-twitter-data-with-hadoop/

在读取twitter数据并使用Flume将其移动到HDFS后，您应该考虑使用Spark Core而不是Hive。

相关内容