基于节点内容属性及拓扑结构的引文网络社团划分

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hy3508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引文网络是由文献间引用和被引用的特有关系所构成的整体,其节点代表科技文献,边代表论文之间的引证关系。引文网络中的节点和边蕴含了大量信息,如文本信息、链接信息等,通过对其进行分析和挖掘,可以发现大量有用或潜在的知识。研究表明,引文数据存在明显的集中和离散趋势,同一研究方向的文献往往引用和参考的都是紧密相关的文献,构建知识网络,能够有效地提高研究人员对科技文献的归纳与整理,进而帮助和指导研究人员开展更加有效地科学研究工作。  然而,虽然当前针对引文网络社团划分的研究较多,但多数方法只考虑了论文间的引用关系,而对影响引用行为的相关因素尚缺乏系统而充分研究,少数结合文本属性的混合聚类方法也尚不成熟,且未充分运用至当前引文网络的分析中。同时,由于引文网络是基于引用行为所构建的知识网络,本身存在一定的局限性,例如由于一些非常规动机,可能导致两篇文献出现引用关系,但实际上两篇文献内容并不相关;反之,两篇内容主题十分相似的文献,可能由于其出版时间过于接近而并无直接的引用关系。因此,在对引文网络进行社团划分时,考虑如何改进引文网络,克服其本身的时滞性和偶然性等缺点也是本文的重要研究内容。  针对上述问题,本文基于引文网络的整体结构,运用适当的方法确定引用关系的重要程度,综合考虑引文网络内容属性、拓扑结构及出版时间等特征提出一种改进引文网络的方法,并将内容相似度值以边权形式引入引文网络中,使得引文网络具有语义属性,最终利用复杂网络中社团划分方法将主题相似的文献聚集在一起,从而实现综合考虑引文网络中内容属性及拓扑结构特征进行社团划分。  最后,本文以Scientometrics期刊论文以及合成生物学主题论文为研究对象,从不同角度对本文提出的社团划分方法进行实证研究。研究表明,本文提出的引文网络的社团划分方法可克服传统引文网络中单一考虑网络拓扑结构或内容属性的社团划分方法的不足,可提高社团划分的精准性,为后续引文网络的研究提供了新的视角和方法,在理论和方法上是一次全新的尝试和提升。  本文研究的算法可用于更加准确地分析学科结构、描述知识发展和研究主题转移、探索学科间亲缘关系、分析学科交叉、渗透等。可服务于国家的学科方向选择和创新主体选择,进而服务于我国优势学科方向布局,为摆脱跟踪和模仿、实现并行甚至达到引领发挥支撑作用。
其他文献
随着教学改革的深入,高校越来越重视人文素质教育,将人文素质教育渗透于高校体育教学中,对提高学生综合素质和全面发展有巨大的意义,但是当前高校体育教学中的人文素质教育还
文章从图书馆网络信息系统所面临的危机分析入手,从系统运行环境的危机预防策略,网络信息系统硬件危机预防策略,网络信息系统软件危机预防策略,图书馆网络信息系统网络危机预
行业科技期刊是行业科技工作的重要组成部分,在行业发展过程中起着不可或缺的重要作用。然而,中国行业科技期刊目前的生存状况却不容乐观。中国期刊业在面临入世后更加激烈的国
对于一线体育教师而言,如何提高课堂教学质量,完成教学目标达到全面育人的目的是我们始终不变的追求.结合教学实践,笔者认为工作态度是我们做好体育教学工作的先决条件,什么
在e-Science环境、大数据背景下,政府机构、国际组织、资助机构、期刊出版商等纷纷出台科研数据管理与共享政策,鼓励或要求研究人员提交或发表科研成果的同时,将相关的数据作为
在竞争日益激烈的社会主义市场经济条件下,企业如何定位档案管理、怎样开展档案管理体系建设、采用什么管理方式来提高档案管理水平等,是企业管理者和档案学界共同关注的焦点问
用户心理活动是用户信息行为的基础,是进行信息资源建设的向导。对用户心理进行研究,是切实满足用户信息需求、有效开展信息服务的前提。数字图书馆作为一个大型综合性的信息系
人文社会科学学术期刊的水平体现出一个国家在相关科学领域的研究水平和学术优势,是国家和民族的宝贵精神财富和巨大的无形资产。学术期刊评价对于整个社会科学学科建设和整体
学位
读者权利是被现代社会普遍确立为法律权利的新兴权利类型,对于读者权利的正当性基础,国内图书馆学界先后以法律规定说、基本权利说、信息自由说、综合基础说等几方面来加以概
建立图书馆危机预警体系和危机预警指标体系,利用多级模糊综合评判理论,结合熵权法确定各个指标权重,构建图书馆危机预警等级的定量评判方法.该方法帮助图书馆尽早发现危机,