【摘 要】
:
当前科技论文的评价大多利用文献计量指标和同行评议的方式进行评估。然而,文献计量指标重“量”轻“质”,同行评议受主观因素影响,公平性亦饱受争议。因此,如何根据论文创新点内容,客观衡量科技论文的原创性程度就成为科技评价领域的难点问题,它不仅能为科技评价提供参考依据,对科研立项、项目查新、信息检索等应用也有重要价值。 研究以科技论文创新点为研究对象,探索其原创性量化测度方法。利用语义相关度和上下文语境
论文部分内容阅读
当前科技论文的评价大多利用文献计量指标和同行评议的方式进行评估。然而,文献计量指标重“量”轻“质”,同行评议受主观因素影响,公平性亦饱受争议。因此,如何根据论文创新点内容,客观衡量科技论文的原创性程度就成为科技评价领域的难点问题,它不仅能为科技评价提供参考依据,对科研立项、项目查新、信息检索等应用也有重要价值。
研究以科技论文创新点为研究对象,探索其原创性量化测度方法。利用语义相关度和上下文语境,获取创新点中的新知识。根据新知识在已有知识层次中的所处层级和论文对后续研究的影响,设计可量化指标和综合测度方法,最终实现原创性等级测度。具体进行了以下工作:
1)抽取创新点主题词,借助外部知识库和领域特征扩充主题词形式。利用引文网络和主题一时间检索追踪知识源头,获取相关文献。源头追踪方法F值为89.67%,优于传统检索方法,具有可用性。
2)结合上下文语境表征文本,丰富语义信息。改进传统模型,设计BILM+HATT的语义相关二分类模型。通过和已有研究进行相关判断,实现基于语义内容的主题词新颖性识别。识别方法准确率达89.1%,能有效识别新主题词。
3)构建共现网络,挖掘创新点中的组合词。根据关联度和共现率进行筛选。计算文档频率和权重,实现新颖性识别。识别方法准确率达86.57%,能有效获取创新点中的新组合词。
4)根据新知识在已有知识层级中的层次,设计知识层级指数(KHI)。根据已有的颠覆性指数(D)和改进的扩散力指数(DI),设计测度公式,并提出综合测度方法。根据原创性得分实现等级量化,分为重大原创、中等原创和一般原创三个原创性等级。最后对综合测度方法进行实例分析,验证了方法的有效性。
其他文献
创新发展是世界各经济体的战略发展要点。创新意味着范式的改变、劳动力的解放、生产效率的提高,进而实现社会经济、文化和技术的全面进步。从各国家地区的战略部署来看,突破性创新是部署的重点,其蕴含巨大的经济、科研和国家战略价值。突破性创新作为创新这一概念的下位类,具有非线性、创新性和影响力等多种特征。且特征量化难度大,因此识别和预测的难度较大。如果能对突破性创新进行识别和预测,可以先一步进行科研资金的优化
随着移动通信技术的飞速发展和终端设备的不断升级,内容丰富、形式生动的短视频开始展现传播力优势。在科普领域,移动短视频表现出惊人的生命力,推动了科普的数字化升级。用户接受角度下科普短视频的使用影响因素值得探究。 在校大学生是短视频的重要用户群体,具备较好的短视频使用基础,同时科学知识需求强烈。本研究以在校大学生为研究对象,通过访谈探究其使用科普短视频的影响因素;在访谈的基础上,结合科普短视频的特点
伴随着新知识经济时代和“互联网+”的到来,公众的信息需求呈现出多元、动态、异质的走向,个体信息组织和机构往往受自身能力限制,无法提供完善的信息服务,也无法适应大环境的新变化和新要求。图书馆作为支撑区域知识信息发展的中心机构,也不可避免地要加强与其他行业机构的深度合作交流,放宽眼界,寻求新的合作对象与合作模式,不断探索与政府、企业、科研机构等不同对象的合作模式以占领信息服务高地。但是当前图书馆尤其是
在生命医学领域,以论文(Paper)、专利(Patent)、临床试验(Clinical Trial,CT)、疾病(Disease)和药物(Drug)等为核心的科技数据资源呈“井喷式”增长,规模庞大的数据资源促进了数据驱动的知识发现与技术突破,也对科研人员高效利用数据、发现深层次知识带来了新的挑战。学科知识问答综合运用自然语言处理、知识组织、信息检索及机器学习等技术对学科领域的各种“碎片化”的数据进
国家“双一流”建设背景下,一流大学的建设离不开一流学科建设。科研水平是学科整体实力的重要组成部分,科学合理地评价学科的科研水平,认清我国学科与世界一流学科科研水平的差距,不仅有利于完善学科的科研管理机制,树立正确的学科发展观,也可以为相关部门制定学科发展战略提供依据。 本文通过调研国内外学科科研评价现状,总结现有问题并确立本文拟解决的两个问题,即指标的国际可比性问题和学科的分类评价问题。首先,对
开放科研数据实践推进过程中基础设施、政策环境、配套服务等投入不断完善,科研人员对开放科研数据重用的参与度较低、存在诸多顾虑、结果反馈较少,成为继续推进该运动的现实困境。科研人员的数据重用行为是开放科研数据理念推行和效果评价的关键环节,有利于最大化发挥科研数据价值、促进科研创新。以科研数据重用环节为切入点,形成科研数据重用与开放共享相互促进机制(数据重用生态系统),兼具降低投入和可持续发展的优势。本
技术演化分析能帮助国家、企业或研究人员梳理技术发展脉络,把握技术发展趋势。目前,科研界已经提出了一系列比较成熟的技术演化研究方法,通常基于专利元数据或专利文本内容开展技术演化研究,专利分类在这两类研究中被作为既成技术知识体系使用,但并未考虑到专利分类体系也随着技术发展和演化而被修订。鉴于此,本文提出结合专利分类体系修订及其专利公开数据来研究技术演化这一命题. 首先,本文充分调研了专利分类体系及其
天文科学数据,指的是用计算机方法分析望远镜收集的真实的海量观测数据辅助天文学家处理分析科学现象,进而从中发现新的天体、空间和物理规律,进一步了解人类身处的宇宙。天文科学数据的管理包括数据的收集、存档、分析、理解、访问和重用等活动阶段,数据正在成为天文领域内新的通货,对于天文领域的发展具有至关重要的作用。天文科学数据的利益主体,是天文数据管理的重要组成部分,各个利益主体伴随着大量的知识活动,形成了对
在数据价值时代,产生、使用和管理数据信息,对于消费者、政府和企业的正常生活和运转必不可少。其中,如何使用与评价新型的、数量急剧增长的产业数据资源是人们亟需解决的问题。为此,学术界更加注重推动数据增长的未来宏观趋势,同时也加强评估数据业务流程,从数据产生、存储、使用和管理等各个方面研究产业智库专业数据体系,挖掘产业数据未来价值。 然而,目前产业智库专业数据体系还存在整体规划混乱、定位不清、数据供给
随着互联网以及信息技术的飞速发展,网络中的信息资源呈指数级增长,人们很难做到不知疲倦地学习,开始期待计算机能够自动从海量信息中学习知识并像人一样进行表达和创作。自动生成具有对比关系的段落文本,不仅可以帮助人们自动获取文本之间对比的重要内容,而且能够节约人们写作的时间与精力,为面向特定写作关系的文本自动生成研究提供了一些思路,也为面向特定写作意图的机器自动写作的研究和应用提供了参考。 本研究着眼于