Hadoop Map/Reduce与数据库



我对hadoop非常陌生,对它的map/reduce功能了解了一点,了解它的wordcount演示,但在与数据库特定计算相关的过程中没有实际使用hadoop map/reduze。在某些计算或特定于数据库的处理中,映射/减少对我的帮助并不是正确的。有人能给我提供一个链接或一些指南吗?这将帮助我获得什么是最好的用途,以及我可以实现哪些senerio来更好地理解Hadoopmap/reduce部分。

Hadoop提供了两种输入和输出格式。基本InputFormat和OutputFormat类可以扩展为自定义的输入/输出格式。

Hadoop附带了DBInputFormat/DBCoutputFormat。以下是Cloudera关于使用MapReduce和数据库的文档。

相关内容

  • 没有找到相关文章

最新更新