基于熵值的领域科学突破主题的识别与预测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:javapages
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
创新发展是世界各经济体的战略发展要点。创新意味着范式的改变、劳动力的解放、生产效率的提高,进而实现社会经济、文化和技术的全面进步。从各国家地区的战略部署来看,突破性创新是部署的重点,其蕴含巨大的经济、科研和国家战略价值。突破性创新作为创新这一概念的下位类,具有非线性、创新性和影响力等多种特征。且特征量化难度大,因此识别和预测的难度较大。如果能对突破性创新进行识别和预测,可以先一步进行科研资金的优化配置、科研人员的合理调度和科研资源的重点投入,率先取得重点领域的科学突破和完成技术转型变革,占领技术高地。科学论文作为科学创新的重要载体,是突破性创新研究的重要数据来源。通过对科学论文的内容解读识别突破性创新,有助于深入了解突破性创新的发展规律和特点,对于后续研究的开展和管理决策的制定有重要作用。当前,已有研究对于突破性创新的测度大多从创新性、新颖性或者学科交叉性等较为单一的维度开展,也就是大多以某一个具体特征作为突破口进行测度,这就忽略了知识发展是一个整体动态发展这一基本特征,突破性创新的出现是依据每个知识单元之间的连接共同作用下的结果。
  本研究以科学论文作为主要的研究对象,没有将技术内容考虑在内,是以科学突破主题为研究对象,针对的是领域级别的科学研究,尝试对这类主题进行识别与预测。主要以主题词共现网络作为知识网络的代项,以科学突破主题会对知识网络整体状态造成“影响”作为突破口进行识别和预测。而其中网络状态的变化就是通过“结构熵”进行测度。因此构建了一套基于熵值的领域科学突破主题识别与预测方法。从而能从知识网络整体发展的视角识别科学突破。该项研究能补充当前突破性创新研究的理论研究,并具备一定的现实应用意义。本研究主要内容主要包括以下三个方面:
  首先,对创新领域内涵较为接近的几个概念从定性和定量两个维度进行了辨析,梳理了当前已有研究提出的突破性创新所应该具备的特征和识别方法的不足,最后明确了在识别突破性创新时需要重点关注的特征,为后续本研究提出的方法模型体系提供了理论支撑。
  之后,提出了基于熵值识别和预测科学突破的方法体系。熵值即是知识网络状态测度的指标。首先是就结构熵与知识网络状态之间的关系进行阐述,再梳理已有的结构熵构建方法,归并其优缺点,在既考虑知识网络的组成“节点”和“边”,又考虑知识发展特征“非广延性”的基础上,构建本研究的结构熵指标。之后从网络动态发展(结构熵发生改变的重要时间点)、识别重要主题(对网络结构熵影响较大的社区)和识别重要节点(对网络结构熵影响较大的节点和网络结构熵影响力发生突变的节点)等三方面对科学突破展开识别和预测。
  最后,在实证阶段是以“基因工程疫苗”领域的科学论文作为研究对象开展。在识别阶段主要是从结构熵的三方面开展,同时在识别阶段还与现有的新兴主题识别和突变主题识别结果进行了比对。预测阶段首先是通过链路预测方法构建预测的新网络,再从重要主题和重要主题词两方面进行科学突破的筛选。最后通过专家评估方法的有效性。实证结果证明,本文所提出的基于熵值的科学突破的识别和预测方法在基因工程疫苗领域有一定的应用价值,在知识体量越发巨大的今天,能在一定程度上对领域科学突破进行识别和预测,减轻人力筛选的负担,更快速高效地实现探测。
其他文献
研究前沿(Research Front)是科学研究中最新、最具前瞻性和引领性的研究方向,其作为科技创新的突破口和新生长点,备受关注,尤其是在《国家创新驱动发展战略纲要》全面实施以来。面对科技创新发展新趋势,研究如何及早、准确识别研究前沿,预测未来方向和重点,对更好服务国家科技宏观决策、合理配置科技资源、帮助科研工作者及时把握科学研究动态,均具有重要意义。当前,研究前沿识别主要有基于引用、基于内容以
学位
传统引文分析主要考虑论文之间的引用数量联系,但引文之间存在着更为丰富的语义关联,如引用动机、引用情感倾向等。为了更加有效揭示论文之间的内容联系,论文提出引用对象的概念来描述论文与引文内容上的关联点,并探索应用当前信息技术的发展成果,实现引用对象的自动识别,揭示引文重要知识单元,有助于从语义角度评价引文的学术贡献。  论文梳理了国内外相关研究进展,总结提出存在两种引用对象——术语型引用对象和事实型引
学位
在传统学术交流机制中,科研过程中的“非正式交流”与以商业学术出版为代表的“正式交流”相互分离,致使原本贯穿科研过程的“研究产生交流、交流促进研究”连贯一体化的状态被破坏,多元交互的交流机制被碎片化甚至孤岛化。  随着数字内容和信息网络的发展,已经出现了以开放获取(Open Access,OA)为代表的学术信息传播的新形态和以社交媒体(Twitter、Facebook、LinkedIn、Resear
学位
世界已经从信息时代逐步进入到大数据时代,海量数据中很大一部分是用自然语言记录的文本数据。而电子公文作为文本数据类型的一种,它是政府机关、企事业单位等形成、具有法律效力和规范体式的数字形式的文件。历年累积的电子公文归档保存后一般按照内容进行人工主题标引、分类组织或者建立专题数据库以方便检索和开发利用。但人工标引主题方式存在劳动量大、速度慢、标引不一致等弊端,因此需要研究电子公文主题自动标引方法。  
学位
人类社会的进步和发展得益于技术的开发与广泛应用。技术和人文的相互融合共同推动了图书馆新的变革与转型,其中一个重要的趋势是向智慧图书馆方向发展。近年来,以人工智能技术等为代表的新兴技术蓬勃兴起,智慧城市、智慧社会、智慧社区和智慧校园等“智慧化”实践不断推进,用户信息需求仍在不断升级,这些环境的变化为图书馆的发展带来了契机,也带来了挑战。加快智慧图书馆建设,不断丰富服务内容、创新服务方式、提升服务水平
随着科学技术的不断进步,科技创新成果涌现,生产力迅猛发展,对于各行各业的影响日益加深,科学技术成为促进经济增长、推动产业革命的重要源泉,科技竞争力逐渐成为国家地位的保障。科技竞争力地位的不断提高对于情报学界的研究范式提出了新的要求,注重尽早发现、识别科技创新的前沿、热点,并评估其发展趋势,以支撑相关科技发展决策。  数据科学时代,科技情报分析与研究的问题往往更为综合,涉及要素更为多元,同时也更为细
学位
在技术创新领域,新兴技术的识别与预测已成为研究热点。无论对于国家、企业或是研究机构,坚持创新驱动发展,把握新兴技术这一技术创新的动力之源,率先抢占技术机会,准确掌控未来技术发展的方向,具有重要的意义。而目前新兴技术的识别研究多集中在发展态势已初具规模、对行业经济已产生一定影响的技术集群中,忽略了现阶段特征不明显、与大多数技术有较大偏离、但具有新兴发展潜力的技术领域。因此,挖掘有关数据中未规模化兴起
科技成果转化是促进科技与经济结合,推动我国新旧动能转换的重要手段。科研院所是科技创新的重要机构,是科技成果供给侧的重要组成部分。近年来,国家出台了一系列激发科研人员创新活力的政策,对于科技成果转化的重视程度不断加强。然而,我国科研院所的科技成果转化仍存在较多阻碍因素,转化效率亟待提高。其中,信息不对称、信息渠道不畅通以及提供服务的人才队伍综合能力欠缺是制约科技成果转化的重要原因。作为专业化信息服务
对于人类社会而言,人才始终是最宝贵的资源,是最重要的财富,是推动经济社会发展的原动力。纵观世界各国,人才始终是国家发展之根基,是科技创新之力量源泉,是决定国家竞争力的关键要素。科学地评价人才是科研事业健康发展的基本前提之一,具有重要的意义。而科学家是整个人才队伍的核心力量、是科技事业的中坚力量,是科技创新的根基,拥有高水平的、领军的科学家对于国家科技竞争力具有决定性的作用。  科学家的评价工作由来
学位
科研环境的转变为科技情报机构从文献传递到信息服务(情报1.0)、从信息服务到知识服务(情报2.0)、从知识服务到智能服务(情报3.0)带来了机遇和挑战。然而,当前我国的科技查新工作很大程度上仍依赖于人工操作,依靠查新员的主观判断很难对科技查新的质量进行控制。为了提高科技查新工作的质量,实现查新的精准检索,将信息技术与传统的查新相结合成为查新工作的创新实践,虽然目前已有关于自动化查新平台建设的探讨,
学位