主题相关度Tr-PageRank算法及其在引文评价中的应用研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:zhao2345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
PageRank算法是网页排序的经典算法,在链接网络领域已得到广泛的应用。主题是文献网络中不可忽略的重要元素,于是在对文献评价算法的设计中需要予以关注。本文主要研究文献网络中PageRank算法的设计与应用。  文章由理论研究、模拟实验以及实证分析三个部分构成,旨在提出适用于文献评价的PageRank算法,在PageRank算法中融入主题相关度信息,力图解决在文献检索时可能产生的主题漂移问题。  本文首先探讨了经典的网页排序算法——PageRank算法,讨论了在网页结构中针对主题漂移问题的TS-PageRank算法。结合引文网络中主题在链接结构的重要特点,提出适用于引文网中文献评价的新算法——TR-PageRank算法。然后模拟实验中,设计了两类数据说明TR-PageRank算法的有效性。  第三部分是算法的实证研究。通过TR-PageRank算法在引文网络中的应用研究,发现在主题漂移问题控制、直接利用文献与主题的相关度方面有较好的表现。在引文主题检索时,使用TR-PageRank算法能够为科研人员有效地检索出与查询主题相关度高,且被引次数多或被重要文献引用的文献,为科研人员提供了精准定位主题的文献排序算法。
其他文献
变量的测量误差问题可以在包括经济学、流行病学、工程学等在内的几乎所有的应用领域里出现,而人们在进行数据分析时这些误差常常被忽略,其原因可能是测量误差均非已知,而无从列
在移动自组织网络(Ad-hoc)、基于中继的蜂窝网和智能传输系统中,发射端和接收端都处在移动状态的移动到移动(M-to-M)通信系统发挥着越来越重要的作用。由于信号的传播环境随着
我们引入了H-扭的李代数胚和H-扭的柯朗代数胚,并给出了一些例子,其中的一个例子来自于最高次是3的微分分次辛流形。我们还研究了最高次是2的N-分次辛流形的外尔量子化。作为
截至2010年12月,我国外汇储备已经突破2.84万亿美元,是世界上外汇储备最多的国家。外汇储备是一国经济实力的重要体现,外汇储备的大幅度增长,使国内外对我国宏观经济政策、人民币
本文将借助于Hamilton-Jacobi理论研究算子L=-div(A▽)++++h(0.1)以及对应的Schr(o)dinger算子Ls=-div(A▽)+(0.2)的精确基本解,其中A是n×n对称正定实矩阵,f和g欧氏空间Rn中的
文章中,我们给出变分不等式的相关理论和发展,并建立一个k步投影迭代算法。设H是一个实的Hilbert空间,并且K是H的一个非空的闭凸子集,对任意的初始点x1,0,x2,0,x3,0,…,xk,0∈K,计算序列{
该文考虑了在脉冲作用下的生态和流行病模型,给出了在脉冲作用下种群时滞模型的持续性、Volterra系统周期解的存在性,在脉冲作用下流行病模型的稳定性及其依靠媒介传染的流行
近年来,随着电子技术设备的大量投入,铁路安全生产面临两个急需解决的问题:一是职工的业务素质和业务技能;二是一些影响安全生产的技术难题。成都电务段党委充分依靠党组织的
金融是现代经济的核心,然而金融本身总是存在着难以预料的波动和风险。在现代的金融风险管理中,金融风险度量方法一直发挥着重要的作用,其中风险价值(Value at Risk,VaR)作为市场
数量化方法应用于投资的研究和实践,近几年在我国越来越受到重视。对于投资策略的设计或评估而言,最重要的两方面评价分别是投资策略的收益能力和风险大小。市场是在不停变化的