论文部分内容阅读
PageRank算法是网页排序的经典算法,在链接网络领域已得到广泛的应用。主题是文献网络中不可忽略的重要元素,于是在对文献评价算法的设计中需要予以关注。本文主要研究文献网络中PageRank算法的设计与应用。 文章由理论研究、模拟实验以及实证分析三个部分构成,旨在提出适用于文献评价的PageRank算法,在PageRank算法中融入主题相关度信息,力图解决在文献检索时可能产生的主题漂移问题。 本文首先探讨了经典的网页排序算法——PageRank算法,讨论了在网页结构中针对主题漂移问题的TS-PageRank算法。结合引文网络中主题在链接结构的重要特点,提出适用于引文网中文献评价的新算法——TR-PageRank算法。然后模拟实验中,设计了两类数据说明TR-PageRank算法的有效性。 第三部分是算法的实证研究。通过TR-PageRank算法在引文网络中的应用研究,发现在主题漂移问题控制、直接利用文献与主题的相关度方面有较好的表现。在引文主题检索时,使用TR-PageRank算法能够为科研人员有效地检索出与查询主题相关度高,且被引次数多或被重要文献引用的文献,为科研人员提供了精准定位主题的文献排序算法。