基于稀疏分布式表征的学术合作推荐方法研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:zp_3000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术合作推荐是一种利用论文、专利等现有科技信息资源为科研管理人员或研究人员推荐他们关注领域的研究人员的方法,该方法能快速发现并了解领域相关的研究人员和研究内容,促进开展进一步的交流合作,带来更好的知识和资源共享,加快科研进程,有利于取得更大的科研成果。本论文通过对国内外当前学术合作推荐方法进行调研分析,发现现有的基于作者文本内容的合作推荐方法对文本语义内容的表示通常基于词频统计,较少关注研究内容的相关性,可能遗漏部分有价值的推荐对象,或者对于不同的语料需要重新进行训练,适应性差,在实际应用中效率较低;而基于网络拓扑结构的方法受网络结构影响较大,在不连通网络中表现较差,限制了推荐的选择范围。因此提出了一种基于稀疏分布式表征(Sparse Distributed Representation,SDR)的学术合作推荐方法。  SDR方法基于一种以神经科学为基础的分布式语义机制,将词或者文本转化为一串长且稀疏的二进制向量。向量的每一位均有特定的语义,其对应取值“1”或者“0”分别代表该向量包含或者不包含该位置所代表的语义,不同文本生成的SDR向量可直接计算相似度。本文提出的学术合作推荐方法如下:首先由作者的论文文本生成作者SDR,表征作者的研究内容;再由作者合著网络得到作者间的结构特征,将结构特征与SDR特征相结合,运用支持向量机(SVM)方法进行学术合作推荐。  论文选取NIPS会议第1-10届论文数据集进行实验,运用Precision@N,Recall@N,F1-measure指标进行评价。首先将基于SDR相似性的方法与基于内容的TF-IDF方法以及LDA方法进行对比,实验结果证实基于SDR的学术合作推荐方法整体上好于TF-IDF和LDA方法;再将SDR方法与基于网络结构的共同邻居方法进行对比,说明了在不连通网络中SDR的表现要好于共同邻居方法;最后将SDR方法结合网络结构特征进行了实验,相比单独的SDR方法,推荐效果有明显提高,说明了方法的有效性。实验结果说明了SDR是一种有效的学术合作推荐方法,且有较好的性能和对不同领域的适应性,并能与其它特征结合用于学术合作推荐。
其他文献
本文对已有的国内外信息资源建设理论进行了整理、分析、总结和综述,在信息资源建设概念的基础上,由“后评估时期”这一角度入手,在肯定了评估给高校图书馆信息资源建设带来
随着信息化浪潮席卷全球,其发展水平已经成为衡量国家综合国力和国际竞争力的重要标志。如今,轻轻一点鼠标,数千兆字节的敏感信息就会泄露出去,信息技术“双刃剑”效应使信息
随着互联网的发展,网络上信息资源“爆炸性”的增长,如何帮助用户从海量信息中快速查找需要的信息,成为信息检索的研究重点。目前国内外基于本体的信息检索研究主要是探讨如何利
[目的 /意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法 /过程]选取中国知网(CNKI)数据库及万方数据知
由于Web2.0网络环境日趋复杂,用以往的网络信息组织理论和方法已经不能有效解决Web2.0环境下的多种信息组织问题。因此,需要从新的视角、引入新的理论和方法对网络信息组织进
生命安全教育是提高人们生存技能、提升人们生命质量的观念、知识与技能集结为一体的一种综合性理论体系与教育实践活动.其可以帮助人们更好的认知生命、感知生命,使人们懂得
[目的 /意义]旨在使企业充分认识移动环境下知识共享特点并有效利用移动环境下网络资源,推动企业知识共享网络的建设。[方法 /过程]在理论层面,以知识共享、社会网络理论为基
兴趣是思维的源泉,是最好的老师。在数学教学中,有目的、有计划、有步骤地培养学生的兴趣,有着不可替代的作用,只有对学习产生了兴趣,才能促使他们主动地学习。数学具有高度的抽象
自上个世纪60年代迄今,现代计算机网络已经有40年的历史,特别是90年代中后期Internet的快速成长,使网络渗透到社会生活的各个环节。然而数量的激增并不能保证质量,如若没有一个积
黑龙江垦区是全国规模最大、农业信息化、农业机械化程度最高的国有农场经济区域。从王震将军率领50万转业官兵开垦北大荒开始,经过六十年的发展建设,昔日的北大荒已成为今日