服务于科技查新的词表构建研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:zble44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长期的查新实践发现,查新员在实际工作中形成了行之有效的检索技能和方法,反复验证并固化了其检索逻辑,如对技术层次的分解和概括、检索词的确定与扩展、检索式的组配等,这种隐性知识难以表征和传授,查新机构难以共享和管理,存在大量隐性知识流失现象,构建查新词表是将查新员检索经验显性化并加以优化整合的一种途径。
  本研究首先从词表与业务需求、跨学科检索、中英文翻译和查新员经验的积累总结4个角度分析查新员需求,从检索词难确定、检索词扩展和检索失败3个方面分析查新检索流程问题,基于此提出查新词表的框架设计,确定词表结构包括查新总表、学科领域分类表、技术领域分类表和中英文对照表4个部分。
  在词表的构建实现上选择计算机技术领域已有查新报告作为主要数据源,通过考虑词频、词长、词性和词的位置影响因素加权的TextRank算法完成关键词抽取,基于查新数据特征选择字面相似度和同义词词林等方法实现词间关系识别,并结合查新业务需求引入《汉语主题词表》相关部分补充和完善查新词表。最终选择基于查新文档相似性探测场景的实验和查新检索中词表使用验证2个场景完成查新词表的评估。词表的构建目标是将查新员的隐性知识显性化,成为查新领域专用词典,为应用场景(推荐、检索、问答系统、文档分类等)提供支撑和铺垫。
其他文献
当今科技服务在现代服务业已经有着举足轻重的地位,科技服务对经济与社会发展的促进作用已日益明显。本着促进科技资源公益服务发展的原则,综合运用服务评价、指标体系的有关理论和方法,科学、合理地将科技资源服务公益价值进行评估,对科技服务业发展具有现实意义。当前科技资源公益服务价值评估领域还没有形成适用于多种类型科技资源特点与性质的价值评估指标体系,不利于科技服务业的发展,因此化解此项难题迫在眉睫。本文基于
学位
近年来,随着国家大力鼓励科技创新,不仅国家级、省级项目的申报数量大幅增长,中小型企业的自主创新能力也在逐年递增,呈现出查新数量激增的趋势。随着大量的科技查新需求产生,科技查新服务模式中存在的问题一一出现,对科技查新服务模式的升级成为了必然要求。在此背景下,引入技术竞争情报中技术尽职调查的服务模式,通过调研专业查新机构的科技查新服务现状及科技查新服务模式升级的需求情况,分析目前科技查新服务模式中存在
学位
“后疫情”时代加速了人们生活、学习和工作方式的改变,数字经济成为主要发展趋势。产业数字化、智能化加速发展,推动了疫情防控中新业态、新模式的产生,促使多领域合作的出现。伴随跨领域研究的深入,知识产权的保护加快企业和国家的经济发展。为了整合科研人员与实践人员之间的知识,需要建立跨学科的知识流动。随着科技社会的进步与发展,单一的学科理论、研究方法以及技术不再适用于解决出现的发展问题。通过不同学科领域的交
北京是我国人工智能发展的重要地区,汇集了全国最为丰富的人工智能人才资源。本文以北京市人工智能基础高端人才为研究对象,通过对其结构和流动特征进行分析,以在一定程度上了解我国人工智能基础研究高端人才队伍的现状,为政策制定找到切入点。本文首先通过文献调研,在已有研究成果的基础上,梳理基础研究、高端科技人才、人工智能人才的相关概念及特征。其次,从人才结构和人才流动两个维度,采取文献计量分析、聚类分析、社会
学位
科技资源作为国家重要战略资源,为科技活动提供了物质保障,为科技管理、决策和科学研究提供了基础条件,对于支撑科技发展、提高国家科技创新能力、促进经济发展都具有重要意义。由于科技资源类型多样,其使用主体用户也分不同层次,包含来自科技型企业、高校、科研院所、政府等不同机构的多类用户,不同的用户对科技资源的需求往往不同,用户对科技资源的专业性、个性化、多元化、动态化以及集成化需求不断增强。传统的资源组织描
学位
图书馆是公共文化服务体系建设中的中坚力量,承载着公共文化服务的主要内容。面对人民群众日益增长的文化需求,基本公共文化服务供给不足和配置不均问题日渐凸显。在此背景之下,如何促进图书馆资源的合理配置,更好地惠及人民群众,是图书馆更新建设的重要内容。可达性作为公共设施服务效能和空间布局的评价指标,可用于衡量居民到达图书馆的便捷度、图书馆空间布局的合理性。图书馆可达性的研究有助于为政府寻求合理的图书馆空间
随着大数据时代的到来,科技文献数量巨大且增长速度日益加快,获得准确、及时、快速、全面的科技情报、及时了解科技发展态势是每位科研人员的工作需求和共同难题。一方面,现有的科技文献信息系统侧重于保障科技文献获取,检索系统侧重于针对元数据的查询或者文中词语的组织与索引,距离满足科技情报需求还有一定差距。另一方面,科研人员在进行科学研究时也面临着课题选择、投稿期刊选择、合作伙伴选择、基金申请选择等科研决策方
学位
在创新驱动发展的大背景下,科技查新和文献检索等科技咨询服务逐步走向市场化,使得查新工作不仅仅要面临着来自市场严峻考验,而且查新的内涵与服务模式也发生了相应的变化。基于此,更多的检索手段被提出,更多的查新分析方法被投入,服务内容也更有深度。  本文提出了将对抗学习的方法应用到查新检索式的自动生成中,旨在为科技查新服务提供自动化流程。将模型部署到面向自动处理的科技查新系统平台中,实现了依据查新委托单中
学位
随着知识经济的到来,创新能力成为衡量区域竞争力的重要标准,也是区域经济增长的源泉。我国已全面进入创新驱动发展的新时代,区域创新是解决区域发展不平衡问题的根本途径,是国家创新发展的基础。为提升区域创新能力,从东部率先发展、西部开发、东北振兴和中部崛起到京津冀协同发展、粤港澳大湾区、长三角一体化等,我国实施了一系列区域发展战略,在这些战略的支撑下,京津冀、长三角、珠三角、长江中游、成渝等十个主要区域的
学位
自从我国加入WTO世界贸易组织后,从DVD、打火机、彩电等传统行业再到生物医药、数码芯片等高科技行业,我国在专利方面频繁遭遇专利摩擦和专利纠纷,给我国的产业、科技发展造成了巨大损失和威胁。专利风险研究尤其是国家层次的专利风险研究对于规避这种损失和威胁具有重要意义。  本文面向国家层次专利风险预警需求,基于专利组合分析方法,综合运用风险管理理论和预警管理理论,对专利风险(特别是国家层次专利风险)的内