论文部分内容阅读
技术创新已成为产业发展的重要推动力,在全球经济发展中扮演越来越重要的角色,一个国家经济活力与竞争力也越来越依赖于技术创新。专利技术挖掘是一套辅助技术创新的理论与方法,它采用自然语言处理、文本挖掘、语义分析等技术手段,对专利文献中显性与隐性信息进行分析、挖掘,帮助用户快速发现领域中研发人员分布(Who)、技术随时间演化(When)、技术地理分布(Where)、技术内涵(What)、技术实现途径(How)与技术研发动机(Why)等信息。宏观层面上,专利技术挖掘可为国家制定相关技术发展政策提供决策支撑;中观层面上,它可指导机构规划技术研发战略;微观层面上,它可辅助研究人员进行具体技术创新。 专利技术挖掘的载体是专利文献,对象是专利文献中显性与隐性技术信息。如何将技术信息从专利文献中挖掘出来,并进行结构化组织、语义化表示,使其可定量化计算,是专利技术挖掘的基础与前提。TRIZ是发明问题解决理论(Theory of Inventive Problem Solving)的俄文缩写;语义TRIZ是在专利日益膨胀的大背景下,对经典TRIZ的语义扩展。它是一种对专利技术信息进行挖掘、组织的方式,被广泛利用于专利技术挖掘中。但是,现有语义TRIZ存在“结构简单、粒度较粗、领域较泛、成本较高”等不足,不能满足个性化、深度专利技术挖掘的需求。 对专利技术信息进行语义索引的粒度与结构决定了技术挖掘的深度、广度与维度。鉴于现有研究的局限,论文提出一个基于多维索引的个性化语义TRIZ体系结构。从知识组织视角上看,该语义TRIZ包括微观层基础语义单元SAO(Subj ect-Action-Obj ect)、中观层技术主题与宏观层技术范畴。从情报分析视角上看,该语义TRIZ又可以分为概念空间、索引空间、应用空间三个数据空间。概念空间是领域核心概念组成的集合,数据量较小。索引空间是针对领域完整专利数据的语义索引,相对概念空间,索引空间的数据量大得多。应用空间语义TRIZ是对具体技术挖掘结果的语义索引,它是一种开放性的语义索引。 为了使该语义TRIZ具备实用性,论文分别从概念空间、索引空间、应用空间出发,研究了半自动构建该语义TRIZ的流程、方法及关键技术。概念空间语义TRIZ的构建以专家人工标引为主、计算机协助索引为辅。索引空间语义TRIZ构建,以数据挖掘和机器学习为主、专家人工干预为辅,概念空间语义TRIZ是其学习的对象与语义映射的参照。应用空间语义TRIZ的构建则需要根据具体情况来进行。 论文选择较小数据量级石墨烯传感器专利进行专利技术演化分析、较大数据量级大口径光学元件专利进行专利自动分类研究。上述实证研究展示了不同数据量级的个性化语义TRIZ构建及基于该语义TRIZ进行技术挖掘的过程。 论文的主要创新贡献为:首先,论文提出了一个基于多维索引的个性化语义TRIZ体系结构。该语义TRIZ从微观层、中观层、宏观层对专利的技术信息进行多层面、多角度地深度揭示与语义关联,实现了技术信息的结构化组织、语义化表示与可定量化计算。相对面向所有技术领域,提供普遍服务的商业语义TRIZ,该语义TRIZ具有“个性化、细粒度、多维度、可计算”的优点,可更有效支持面向特定技术领域、深度专利技术挖掘。针对较大数据量级专利,论文结合机器学习、数据挖掘相关技术,实现了该语义TRIZ的半自动构建,有效拓展了个性化语义TRIZ的应用范围,提升了其实用价值。其次,基于个性化语义TRIZ,论文提出了一种通过定量计算来自动挖掘技术问题与技术方案间语义关系的方法。该方法可以自动挖掘技术问题与技术方案之间“相同(Same)、相关(Relate)、解决(Solve)、革新(Update)、进化(Evolve)”五种语义关系,供领域专家参考。实证研究结果显示:该方法克服了个体主观性因素,能帮助领域专家快速、准确的界定技术问题与技术方案间的语义关系,提高了技术演化分析的效率。再次,基于个性化语义TRIZ,论文实现了针对特定技术领域,半自动的构建面向TRIZ应用的个性化分类体系。该分类体系由多个具体的宏观层技术范畴、中观层技术主题组成,可以帮助用户快速发现本领域中专利都采用了哪些技术方案、解决了什么样的技术问题,实现了什么样的技术功能,取得了什么样的技术效果。实证研究结果表明:与IPC等分类体系相比,该分类体系具有细粒度、多维度、动态化、个性化的优点。 总之,基于现有研究的不足与专利技术挖掘的实际需求,论文提出了一个基于多维索引的个性化语义TRIZ体系结构,实现了该语义TRIZ的半自动构建,并针对“技术演化分析”与“专利自动分类”两个场景进行了实证研究。结果表明:该语义TRIZ能深化专利技术挖掘深度、拓展专利技术挖掘范围、更新专利技术挖掘视角、提升专利技术挖掘的效率。