面向研究前沿演进分析应用的知识元计量方法探索

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zel1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以专业用户情报需求为核心的知识服务理论,给支撑科技战略情报工作的计量学研究提出了新的实践要求。传统的科学计量研究大都以文献的形式特征和核心知识内容概括特征(主题范畴)为计量对象,欠缺对同主题文献间内容特异知识元以及不同主题相同知识元的计量,失去了通过知识元来表征文献内容的深层次逻辑关系的机会。  科技战略情报的基本任务是:通过提供事实数据及其关联证据,来监测分析科技发展的动态和动向,以把握科技发展大势、研判科技发展方向、识别科技创新突破口和生长点。ESI研究前沿(Research Fronts)作为对全球科技发展布局和竞争结构的揭示,可以为前瞻谋划和布局前沿科技领域与方向提供重要的情报参考。ESI研究前沿不是静态固化的,而是不断演变和动态发展的,如何深入挖掘研究前沿内在科学知识结构及其演进规律理应成为科技情报研究的重要选题。目前国内鲜有将ESI研究前沿数据深入到学科领域知识本身进行分析研究的报道;而且现有对某领域研究前沿的演进分析也往往依靠人工判读,缺乏数据层面的客观计量支撑。  当前对科学知识演化的分析主要以词语在学科主题中的浅层关联入手,短板在于对科技文献内创新知识的抽取及其流动扩散规律关照不够。词语语义分析也多是从对自然语言理解技术应用出发,没有从科技专业知识创新发展演化的内在逻辑入手。由于现有词语语义变迁研究并未将词语变化置于科学知识演化情境,使得对表征领域知识的词语在前沿主题中的分布变迁问题关注不足。此外,情报学领域缺少先进的技术方法对研究前沿的动态演化过程和领域知识在前沿主题中的分布变化进行识别探测,而传统数据挖掘领域由于其技术导向特征,往往缺乏对于领域前沿深入的知识内容分析。  基于上述背景,本文围绕当前相关研究理论方法存在的主要问题,提出了一种深入到科技文献全文内部、以文献中隐性专业知识本身作为计量对象的科学计量方法。课题首先对专业知识元和知识元计量方法进行探索构建。然后在理论构建基础上,面向ESI研究前沿的定量演进应用,结合命名实体识别、语义标注、机器学习、自然语言处理等数据挖掘技术,从不同知识元量化角度展开实验探索——基于知识元共现、迁移、变异的ESI研究前沿演进分析。  论文所做工作和主要贡献体现在以下两个方面:  (1)厘清专业知识元的概念,提出知识元计量方法。  结合案例创新性的构建了一种具有计量属性、表征科学内涵的专业知识元,并探索提出了知识元计量方法。知识元计量方法,可以深入到文献内部、以文献中隐性专业知识本身作为计量对象,能够实现科学计量与内容分析的有机结合,通过对文献中专业知识元的抽取分析,为用户提供解决实际问题的知识产品,提高用户知识发现效率,实现精准知识服务。  (2)基于科技文献全文本数据,创新设计3种知识元计量方法指标,以数据挖掘技术为辅助,分层次深入展开ESI研究前沿演进分析。  课题基于OSCAR4命名实体识别技术,对研究前沿核心论文施引文献全文的实验片段进行抽取,得到代表文献关键创新知识点的化学实体知识元。在此基础上,首先,基于知识元共现网络的中心性指标和模块度特征,开展知识元共现的研究前沿演进分析。然后,计算知识元对于前沿主题文本的PLDA主题概率和信息熵值,对应设计的前沿贡献度和迁移度指数,测度知识元在同语义主题内不同时期的迁移特征。最后,通过Word2vec训练知识元词向量,使用K-means算法聚类同语义簇知识元,利用TF-IDF计算知识元突发变异程度,进而探测未来可能推动科技前沿创新发展的关键情报特征。总之,基于知识元共现的研究前沿演进分析,旨在从知识元共现、链接、组合关系入手探索研究前沿内部的知识演进特点;基于知识元迁移的研究前沿演进分析,则从个体知识元视角展现研究前沿的微观知识流动规律和机理;而基于知识元变异的研究前沿演进分析,则利用同语义语用簇内知识元的变异指标测度,识别不同时期可能引领研究前沿未来发展方向的重要突发信号。  本文通过与传统基于关键词和主题词计量分析结果的比较,检验该方法的先进性;利用《2017研究前沿》报告结果、权威会议论文、领域专家、专业学科文献等验证该方法的有效性和实用性。结果发现,通过对ESI研究前沿中知识元共现、迁移、变异现象的定量分析,可以从专业领域科学知识构造的微观视角量化解构ESI研究前沿演进变迁规律,更加细粒度地离析研究前沿科学知识随时间推演的变迁、重组、集成、扩散状态,还能够尽早识别未来可能引发重大科技创新和突破的知识变异信号,对于支撑科技战略情报工作实践、科研人员选题指导、决策者学科发展谋划布局均具有一定参考价值和应用意义。
其他文献
目前我们所处的社会是一个高速发展的信息化社会,传统图书馆越来越不能满足这种信息化、网络化的需求,于是,数字图书馆产生了。这其中有两个重要原因促成了数字图书馆的大发展,一
乍看,林小静这篇小说有点像纪实文学.读着读着,不经意间,被作家牵入了一种特殊氛围之中——引人入胜的故事里面.作家用舒缓、平静、不动声色的语言娓娓道来,就那样让读者沿着
期刊
一年一度的“北京·埃森焊接与切割展览会(BEW2013)”于2013年6月18~21日在上海新国际博览中心举办。2013年,全球经济低迷,但即便在此经济形势下,依旧有近千家企业参加北京·
数字资源是以数字形式存在的可供人类作为生存发展基础而利用的信息集合。在当今的信息化社会,数字资源每天都在海量生成。数字资源正逐步成为国家信息资源的主体。然而,来自社
学位
信息技术的快速发展,终生教育和学习型社会逐渐被大众接受,信息作为新的生产要素,越来越得到人们的重视,对信息的来源、质量也提出了更高的要求。  随着高等教育的扩招,中国的大
产业转型升级是经济发展的重要内容,也是现代化经济体系建设的关键.本课题组基于产业转型升级的“动力-结构-效益”耦合机制理论框架,构建了产业转型升级指数评价指标体系,量
期刊
21世纪是一个知识经济信息产业的时代,这个高节奏、高科技、高风险、高竞争和高压力的时代给人们不仅带来了成功的机遇,更多的是无法避免的心理负担和心理挑战。这种负担也无可避免的影响到了青年一代;再者,重新恢复重点学校制度、智育之上、考试至上和升学率导向,高中阶段的文理分科,是基础教育纳入到升学教育的轨道,笼罩在热的应试教育的氛围中,使整个义务教育沦为为考试而学、学习考试、应付考试的教学。它赋予义务教育
信息化时代和网络技术日新月异的更新速度,使得优质的教育资源逐渐普及,学生的信息来源丰富化、知识获取碎片化,学生们越来越强调他们的学习需求和感受.《预防医学》教学有助
为了全方位了解世界各国在南极科学技术和人文社会科学领域的研究成果,为我国南极科研战略和研究管理决策提出建设性建议,本文以Web of science数据库中的ISI proceeding数据库
期刊