专利引文测度指标的时间影响及修正研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:mqshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识产权是国家发展的战略性资源和国际竞争的核心要素。作为专利分析的重要内容,专利引文分析在国家、机构、人员的科技竞争力评估评价中有广泛应用。专利引文分析依赖一系列专利引文测度指标。构建科学、客观、合理的专利引文测度指标具有重要的现实意义。专利引文测度指标受到时间因素的影响,使得在实际评价活动中专利引文测度指标的评价无据可依。本文拟从专利引文测度指标出发,研究时间因素对专利引文测度指标的影响,探索消除该影响的方法,遴选出恰当的修正方法。研究旨在减少技术评价活动中时间对评价结果的影响,形成一般性推广性的结论,为专利信息更好地服务技术评估评价、融入产业经济的发展提供支撑。
  本文首先梳理了国内外相关研究成果,调研了专利引用相关概念及常见指标,分析了时间因素对引文测度指标的影响表现,总结了修正时间对引文测度影响的方法。在专利引用相关概念及常见指标调研的基础上,选取专利被引频次作为研究指标。分析并提出专利引文测度指标无法比较的问题关键在于,不同公开年份和不同统计年份引起的时间差异。
  其次,基于时间对引文测度影响的修正方法调研,筛选出合适的修正方法:百分位数、相对影响指标及固定效应法,并进一步开展修正研究。研究选取被引频次均值和TOP分位数为固定效应水平,建立基于不同技术领域、不同公开年份、不同统计年份的被引频次基准线。采集、处理1975-2017年的美国公开专利及其施引专利数据,将专利按照不同公开年份和不同技术领域分组,选定组内均值和6个TOP分位数(TOP0.01%、TOP0.1%、TOP1%、TOP10%、TOP20%和TOP50%)为被引频次基准,统计当前统计时间点的被引频次基准线。由于专利被引频次随着统计年份的推移而增加,造成在不同统计年份,被引频次的均值和TOP分位数水平不同。然而逐年统计的工作量大、会耗费大量人力物力。针对该问题,统计了基准线的历史时序变化情况。构建BP网络模型,对基准线的历史时序变化情况进行拟合,训练得到最优模型。利用最优模型,预测未来时间点的被引频次基准线。作为研究拓展,采用多元非线性回归方法,对专利被引频次基准线进行拟合,提供专利被引频次基准线更为简洁的公式表达。
  最后,开展案例研究,以热塑性与热固性树脂基复合材料为例,利用本研究的修正方法开展专利态势及其技术竞争力分析,重点用于高被引专利分析和专利权人被引情况分析,提供修正研究的应用案例,并比较修正前后的结果。
  本文建立了基于不同技术领域、不同公开年份和不同统计年份的专利被引频次基准线,为专利引用指标的合理应用提供参考。研究主要有3点创新:(1)本文关注专利引文测度指标的时间影响,并借鉴论文的修正方法进行修正研究,在选题和研究思路上具有新颖性。(2)本文建立了基于不同领域、不同时间范围的专利被引频次指标基准,使得相关指标的评价有据可依。(3)针对专利被引频次的基准值逐年变化且难以计算的问题,本文尝试基于时序变化而不是单一时间截面,探究专利被引频次的基准值的逐年变化情况和增长规律,采用神经网络模型拟合并预测未来时间点的基准值。
其他文献
目前科技论文资源的十分巨大,难以处理,如何对海量数据进行分析、挖掘以及有效组织成为了一个难题。识别论文中并列关系知识单元,即对全文中在结构上或内容上呈并列关系的文本以及其描述的知识种类进行识别抽取,不仅能实现科技论文的重点概要预览,同时也可以实现文中核心知识内容的有效组织,为知识组织、知识抽取等工作提供可靠的数据基础。  本研究以科技论文为研究对象,目标是识别并提取单文档中的核心知识内容,利用文本
学位
信息化社会知识爆炸式增长造成了严重的知识分散问题,对决策的效率效果造成了极大影响。知识晶炼理论及其应用可以将分散的知识进行集中,可极大提高和改善决策效率效果。  本文梳理了国内外知识晶炼理论的演化发展,并通过冰山双循环模型的启发,从物理原理这个源头出发结合工作生活事例,探索提出知识晶炼双循环理论。通过对冰山模型的发展分析,原始的冰山模型被引申为胜任力模型等,本文将原始冰山模型进一步细分出正冰山模型
学位
随着大数据时代的到来,科学研究的模式和方法也在不断创新和发展,数据驱动开始成为科研领域重要的研究范式。科技文献作为科研成果发布的重要形式,海量的信息、数据、知识隐藏于科技文献中,面对从大量科技文献中发现有用的信息、知识和数据的挑战,迫切需要自动化的工具和方法帮助人们从文献中快速、准确的获取真正需要的信息;同时,随着众多学科领域综合集成研究方法的应用,基于大量文献中数据和数值信息的综合集成研究不断深
学位
信息技术的日益发展使得包括人文与社会科学领域在内的各个学科的研究资料逐渐被数字化,大量数据库与相关平台得以构建与运营,这极大地方便了研究者从网络上获取研究资料并开展研究,人文学科研究者采用技术手法从大规模的文献资料中发现新的研究问题并取得研究成果,人文学科有向数字人文发展的趋势。在数字学术环境中,人文学者利用数字资源开展研究,图书馆与信息专业人员对数字资源进行分类和组织,对知识进行描述、揭示、存储
在第四范式科研模式下,对科学数据这类已有科研成果的分析和利用,成为实现科技创新的重要途径。在科研大数据的背景下,科研人员对领域知识点的需求也在不断增强。人工智能的发展也是建立在对人类已有知识的学习、利用再创新基础之上。而领域知识图谱是揭示某一领域知识的语义网络,它能够有效支持科研创新、知识点获取和知识推理等。  本文从科研人员的领域知识点需求出发,通过领域知识图谱的构建,获取领域知识点,满足科研人
文本语义匹配是文本分析中的一项核心问题,旨在从大量文本中筛选出与指定文本在语义上相近的文本集合。目前已有大量面向同源文本的语义匹配研究,这些研究均建立在大规模匹配数据集的基础之上。但在真实场景下,文本语义匹配任务的研究对象往往是异源文本数据,不仅没有可用的匹配数据集,甚至连不同类型文本之间的样本量也极不均衡,所以无法使用以往的方法进行建模。  本研究以科技论文和专利两种科技文献为研究对象,针对无匹
学位
随着科研事业的发展,关于同一主题的研究文献越来越多,基于文献的研究集成(Document-based Research Synthesis)因能系统整合关于同一主题的研究成果,获得综合性结论,而在社会科学领域得到日益广泛的发展和应用。另一方面,研究集成为循证实践和跨领域的集成研究提供了基础。在循证实践中,研究集成能将多个原始研究进系统性整合,从而为实践者提供最佳证据;同时,其作为一种知识集成方法,
学位
技术转移是实现创新的重要手段之一,在“互联网+”的环境下,技术转移信息服务搭建了技术需求方和技术供给方之间的桥梁。虽然目前的一些在线的技术交易平台提供了技术需求登记的功能模块,但是需要技术拥有方主动检索技术需求,联系技术需求方,技术供需方的信息不对称问题仍然没有得到解决。为了在大规模的专利中,面向技术需求实现专利和技术需求的匹配,识别有技术转移潜力的专利,以提高技术转移信息服务水平,本文通过调研相
学位
学者在国家科研发展进程中扮演着重要的角色,学者影响力评价在科学评价中具有重要意义。随着网络技术的发展和新媒体平台的普及,以及开放获取运动的兴起与发展,学术成果的出版形式和传播渠道不再局限于传统的期刊形式,而是逐渐形成具有便捷性、开放性、多样性的在线科研环境。同时,Altmetrics的提出为学者评价提供了新的研究思路,各类基于新媒体平台的Altmetrics指标层出不穷,为学者影响力的综合评价提供
学位
如何有效地揭示科学结构已成为知识发现研究的热点问题。近年来,基于文献网络(如合作网络、引文网络等)的社团结构研究已成为图书情报领域的研究热点,成为科学家借助文献数据开展科学结构研究的有力工具。自2002年社团(Community)概念正式提出以来,社团划分研究逐渐受到关注。然而,多数相关研究工作是基于单一网络的社团划分。其实,网络中的不同关系或不同类型主体可能携带着丰富的语义信息,在研究中可以得到
学位