基于PAJ模型的科研文献实体影响力排序算法的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:liongliong534
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的普及和发展,人们的工作与生活越来越依靠从网络上获取有用的信息。现代的科研工作者为了更好地进行科研工作,往往也从网络上搜集一些重要的科研文献资料。因此,对科研工作者来说,特别是青年科研工作者而言,找到与专业相关的重要学术资源,如重要期刊/会议、重要作者、极具影响力的论文、以及当前研究热点等,是其科研工作的一个重要环节。   学术搜索引擎(Academic search engines)是互联网上搜集学术资源的重要工具。比较著名的学术搜索引擎系统如Citeseer,Google Scholar和Libra能够比较好的完成根据关键字搜索文章的功能,但是往往缺乏对科研文献资源的深入分析,排序功能比较简单。   本文通过深入分析科研文献的具体特点,提出了PAJ模型。然后根据PAJ模型提出了对科研文献实体进行排序的算法,通过矩阵计算的反复迭代,最终收敛到一个稳定的值,来求得科研文献实体的影响力信息,对科研文献实体进行排序。   本文基于万方的数据,开发了基于PAJ模型的对科研文献实体进行排序的系统,并对系统进行了全面的测试。排序结果经过存储与分析后,发现确实能够获得大量有价值的信息,无论是对论文,期刊还是作者的排序都充分挖掘了他们之间的相互联系,能够充分反应相应科研文献实体的影响力的大小。对科研工作者选择合适的科研文献有十分积极地作用。
其他文献
中枢神经系统疾病(CNS disorders)是一组由慢性进行性中枢神经组织退行性变性而引起的疾病总称,主要包括:帕金森病(Parkinsons disease,PD)、脑小血管病(Cerebrovascular disease
随着计算机技术和通信技术的迅速发展,用户需求不断深化与增长,网络规模日益增长,计算机网络应用越来越广泛,用户业务对信息技术的依赖性日益增加。同时,网络病毒、黑客入侵、拒绝
学位
微米木纤维模压加工过程是一个高度复杂的过程,具有非线性、时滞、高维等特性。模压产品具有较高的密度,可以用于装饰装潢,具有较高的应用价值。握钉力是衡量材料力学物理性能的一个重要指标,当材料使用螺钉相连接时,握钉力大小就显的尤其重要。因此,对模压产品的握钉力进行预测成为微米木纤维模压加工研究的重要课题。本文以模压的汽车换挡杆手柄为对象,将机器学习引入到模压产品的握钉力预测上,通过机器学习方法找到一种有
概念是知识表示的核心要素。因此,概念的提取是知识提取中最核心的任务。如何有效地从各类资源中挖掘概念实例是知识提取研究中的一个关键问题。本文分别针对特定领域文本的概
随着信息通讯技术和互联网的发展,互联网金融信息对金融市场的影响已经越来越不容忽视。某一个新事件的发生或者是网络上对某支股票的热议都在很大程度上左右着金融实践者们
随着工业机器人应用范围越来越广,人们对机器人的运动精度也提出更高的要求。由于各种误差因素的影响,机器人理论位姿和实际位姿总是存在着一定的误差,这个误差严重影响着机
随着时代的不断进步,计算机与网络的性能取得了飞速的提高;与此同时,科学研究领域以及工程领域对于计算能力的要求也在与日俱增。在这样的背景下,网格计算技术应运而生。网格
随着高精度质谱技术的飞速发展,基于生物质谱分析的蛋白质、肽段鉴定已经成为蛋白质组学的核心技术。蛋白质、肽段鉴定方法主要分为两大类:数据库搜索和肽段从头测序。数据库
自从Adleman首次利用DNA分子及生化反应求解困难的计算问题以来,不少研究人员希望借助DNA分子海量并行的计算能力、高密集的存储能力及其特定的生物活性来设计一种新型的DNA
计算流体力学(Computational Fluid Dynamics)和有限差分方法(FiniteDifference Method)是科学计算中最为常用的计算方法,其单指令多数据流(SIMD)的计算特点为GPU加速提供了可