论文部分内容阅读
PageRank算法是搜索引擎用于标识网页的等级/重要性的一种方法,但是在实际的应用中,发现它还是存在一定的缺陷.本文提出一种在网页的链接中加入主题相关度的判定(相似矩阵)的方法,可以使网页的PageRank值在具有相似主题的网页上传播,从而减少了主题无关网页对PageRank值的扩散.测试结果表明,改进后的算法可以较好的抑制主题漂移现象,表现出了较好的查全率.