论文部分内容阅读
随着知识领域信息量的疯狂增长,电子文献数目日益庞大,科学文献以电子资源的形式出现于互联网及数字图书馆之中,为实现信息资源共享提供更加便捷的途径。研究学者置身于浩瀚的电子文献海洋中虽拥有足够多的资源,却难以在短时间内查找到对自己研究有意义的相关文献,“信息超载”问题凸显。为了提高研究学者获取学术信息资源的速度与质量,文献推荐技术应运而生。 本文将文献推荐技术、相关反馈等方法相结合,以引用关系模型、主题贡献模型为基础,讨论异构学术网络的构建,进而提出基于改进元路径的随机游走方法、基于异构网络的三层相关反馈方法、以及基于异构网络PageRank方法,实现学术领域文献的推荐。同时,采用相关学术论文数据对所提出的方法分别进行实验验证。本文的主要研究内容可以包括: 1.对基于全文信息以及部分全文信息的引用关系网络中三种主要的引用关系进行建模,并对其在异构学术网络实现文献推荐的性能进行分析。 2.构建了基于全文信息的异构学术网络,提出带有约束条件的元路径以及联合的带约束的元路径概念,创新性地设计了基于改进元路径的伪相关反馈算法,并通过实验来验证算法的有效性。 3.在已有的基于元路径的反馈算法的基础上,融入多种类型反馈信息,提出异构网络中的三层相关反馈模型,主要包括反馈信息层、节点推断层以及随机游走层,从而实现异构网络中文献的排序。同时结合排序学习算法,将基于文本的相关反馈与基于网络的相关反馈的排序特征结合,提高了文献推荐的性能。 4.提出一种在异构信息网络上的全局PageRank算法,引入关系类型重要性概率这一隐含变量,将异构关系同构化,并将EM算法与PageRank算法相结合,计算出不同用户的隐含关系类型重要性概率分布,以此作为用户兴趣模型,进而实现在没有人工干预的情况下的个性化文献推荐。