论文部分内容阅读
Pagerank算法是经典的Web数据挖掘算法,其已经得到了广泛的应用。基于Mapreduce框架的Pagerank算法具有迭代次数多,时空消耗大的缺点,本文根据Mapreduce的特点提出了一种并行的分块Pager-ank算法,其目的是减少迭代次数以及混合阶段和排序阶段的消耗,以此来提高数据挖掘算法的效率。