论文部分内容阅读
HadoopMapReduce环境为云平台编程人员提供了一个复杂的框架,其中,MapReduce是一种编程模型,用于大规模数据集的并行运算。通过MapReduce这个分布式处理框架,不仅能处理大规模数据,而且能将很多繁琐的细节隐藏起来,伸缩性非常好。本文分析7hadoop架构和MapReduce的工作原理,阐述了在云平台上如何执行一个MapReduce作业,介绍了如何编写Mapper和Reducer类以及如何使reporter对象,提出了基于MapReduce架构实现分布式编程的方案。该方案基于Hadoo