【摘 要】
:
随着大数据时代的到来,科技文献数量巨大且增长速度日益加快,获得准确、及时、快速、全面的科技情报、及时了解科技发展态势是每位科研人员的工作需求和共同难题。一方面,现有的科技文献信息系统侧重于保障科技文献获取,检索系统侧重于针对元数据的查询或者文中词语的组织与索引,距离满足科技情报需求还有一定差距。另一方面,科研人员在进行科学研究时也面临着课题选择、投稿期刊选择、合作伙伴选择、基金申请选择等科研决策方
论文部分内容阅读
随着大数据时代的到来,科技文献数量巨大且增长速度日益加快,获得准确、及时、快速、全面的科技情报、及时了解科技发展态势是每位科研人员的工作需求和共同难题。一方面,现有的科技文献信息系统侧重于保障科技文献获取,检索系统侧重于针对元数据的查询或者文中词语的组织与索引,距离满足科技情报需求还有一定差距。另一方面,科研人员在进行科学研究时也面临着课题选择、投稿期刊选择、合作伙伴选择、基金申请选择等科研决策方面的难题。
本文通过梳理科技文献、事件、语义网与语义链接等相关文献内容,分析科技文献内外部特征与文本内容、事件知识组织要素等。文章通过分析科研事件及其关系构建科研事件网络模型。网络模型分别包括发表事件模型、合作事件模型、引用事件模型及整体关联网络模型;文章通过对语义推理和事件关系的定义,使用图查询和图遍历算法,进而实现科研事件关联网络图和实体三元组关系表的自动化形成,最终构建科研事件库。基于科技文献构建科研事件库,建立语义关联规则,进一步实现科研事件关系自动推理,分析科研事件关联网络的特征规律。基于科研事件库,设计事件的新颖性查询与检索应用。
本文主要包括三部分内容。第一部分,以事件为中心的科技文献组织方法,探析科技文献与事件的转化规律、事件类型、事件要素、事件表示、事件关系等;第二部分,基于科技文献构建科研事件库,建立语义关联规则,分析事件库特征规律;第三部分,基于事件库设计新颖性查询应用,对事件进行新颖性评估设计,优化现有查新评估方法。
其他文献
现有文献的分类标引多采用《中图法》。在文献出版量飞速增长的背景下,完全依靠人工进行文献标引已经不可行,通过文本自动分类算法实现机器标引变得非常必要。然而,中图分类体系下存在数据不平衡现象。这影响了现有分类算法的性能,难以达到理想的标引效果。 为改善非平衡数据下分类标引的效果,从数据层面与算法层面相结合的角度提出一种标引方法。在数据层面上,利用LSTM模型为少数类补充样本数据。该方法首先利用类名和
我国源远流长的历史,为后人留下了卷帙浩繁的古文典籍。这些古文献不但具有极高的文学价值,还可以传播历史信息从而兼具历史价值。用机器来实现古文今译,不仅可以跨越古今之间的语言鸿沟,还有助于传递古文献中蕴含的历史知识和文化信息,为古文外译提供重要的参考,促进中华文化走向世界。 在已有的古文机器翻译研究中,多数的研究着力于古文到现代文之间平行语料库的构建,以及将各种机器翻译模型应用在古文到现代文的翻译,
多源异类的科技资源松散孤立,缺少有效地互通协调和配置管理,导致“资源孤岛”现象产生,不利于科技资源协同服务的发展,通过元数据对科技资源关联聚合是有效的途径之一。本文的目的是研究如何基于元数据有效关联聚合科技资源,主要从外部特征、内容特征以及共享特征三个关联维度出发。 本文首先概述国内外科技资源元数据以及科技资源关联聚合相关研究的发展情况,指出目前科技资源关联聚合存在的不足,并总结归纳基于元数据关
专利数量激增与专利审查资源紧缺的矛盾下催生知识产权领域对审查智能化的迫切需求,为了解决人工查找的有限性和现有的检索系统不完善等问题,本研究提出一种智能化的专利无效对比文件判断方法,从海量的专利文件中选取高度相关的对比文件,为相关从业者提供决策辅助。 为了平衡专利所要求的技术公开和发明主体本能维护技术秘密的矛盾,专利中存在着一些独特语言现象,为专利无效对比文件判断带来了困扰。而传统基于专利文本相似
当今科技服务在现代服务业已经有着举足轻重的地位,科技服务对经济与社会发展的促进作用已日益明显。本着促进科技资源公益服务发展的原则,综合运用服务评价、指标体系的有关理论和方法,科学、合理地将科技资源服务公益价值进行评估,对科技服务业发展具有现实意义。当前科技资源公益服务价值评估领域还没有形成适用于多种类型科技资源特点与性质的价值评估指标体系,不利于科技服务业的发展,因此化解此项难题迫在眉睫。本文基于
近年来,随着国家大力鼓励科技创新,不仅国家级、省级项目的申报数量大幅增长,中小型企业的自主创新能力也在逐年递增,呈现出查新数量激增的趋势。随着大量的科技查新需求产生,科技查新服务模式中存在的问题一一出现,对科技查新服务模式的升级成为了必然要求。在此背景下,引入技术竞争情报中技术尽职调查的服务模式,通过调研专业查新机构的科技查新服务现状及科技查新服务模式升级的需求情况,分析目前科技查新服务模式中存在
“后疫情”时代加速了人们生活、学习和工作方式的改变,数字经济成为主要发展趋势。产业数字化、智能化加速发展,推动了疫情防控中新业态、新模式的产生,促使多领域合作的出现。伴随跨领域研究的深入,知识产权的保护加快企业和国家的经济发展。为了整合科研人员与实践人员之间的知识,需要建立跨学科的知识流动。随着科技社会的进步与发展,单一的学科理论、研究方法以及技术不再适用于解决出现的发展问题。通过不同学科领域的交
北京是我国人工智能发展的重要地区,汇集了全国最为丰富的人工智能人才资源。本文以北京市人工智能基础高端人才为研究对象,通过对其结构和流动特征进行分析,以在一定程度上了解我国人工智能基础研究高端人才队伍的现状,为政策制定找到切入点。本文首先通过文献调研,在已有研究成果的基础上,梳理基础研究、高端科技人才、人工智能人才的相关概念及特征。其次,从人才结构和人才流动两个维度,采取文献计量分析、聚类分析、社会
科技资源作为国家重要战略资源,为科技活动提供了物质保障,为科技管理、决策和科学研究提供了基础条件,对于支撑科技发展、提高国家科技创新能力、促进经济发展都具有重要意义。由于科技资源类型多样,其使用主体用户也分不同层次,包含来自科技型企业、高校、科研院所、政府等不同机构的多类用户,不同的用户对科技资源的需求往往不同,用户对科技资源的专业性、个性化、多元化、动态化以及集成化需求不断增强。传统的资源组织描
图书馆是公共文化服务体系建设中的中坚力量,承载着公共文化服务的主要内容。面对人民群众日益增长的文化需求,基本公共文化服务供给不足和配置不均问题日渐凸显。在此背景之下,如何促进图书馆资源的合理配置,更好地惠及人民群众,是图书馆更新建设的重要内容。可达性作为公共设施服务效能和空间布局的评价指标,可用于衡量居民到达图书馆的便捷度、图书馆空间布局的合理性。图书馆可达性的研究有助于为政府寻求合理的图书馆空间