基于动态主题分析的技术主题演化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:gba2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
技术主题演化分析是专利情报挖掘的重要内容之一,针对现有技术主题演化分析方法依赖引文、分类等间接信息,未能直接揭示技术主题的内容的缺陷,本文从文本语义的角度出发,将基于非负矩阵分解(NMF)改进的动态非负矩阵分解模型应用于专利文本的动态主题建模,以实现对技术主题的动态演变分析。  本文基于动态非负矩阵分解提出技术主题演化分析框架,主要研究分为6个步骤:①通过Word2Vec训练词向量获取主题词的分布表示,用于主题模型中主题个数k的确定以及主题之间相似度的计算;②通过动态非负矩阵分解对专利文本进行动态主题建模,获取动态主题及相对应的窗口主题;③利用TextRank抽取名词短语对抽取的主题进行标注,增强主题的可解释性;④通过词向量计算主题之间的演化轨迹,并通过Graphviz可视化展示;⑤选取2002年、2005年、2008年、2011年和2014年五年的五方专利数据进行实证分析。实验抽取了65个技术主题及其演化轨迹,并以“汽车生产与制造相关技术”和“电气设备相关技术”两个技术主题为例,分析技术主题的演化过程;⑥对比分析,对本研究采用的动态非负矩阵分解方法的有效性进行验证。  研究表明:动态非负矩阵分解方法能够充分利用专利的文本内容信息,自动识别专利文本中蕴含的技术主题,并识别其演化路径。  本文将动态主题分析的方法应用于技术主题演化分析研究,有两点创新:一方面,直接基于专利文本内容、而不是专利引用或专利分类等间接信息研究技术主题演化,克服了后一种方法粒度较粗、可解释性较差、难以直接揭示技术内容特征等不足,是技术主题演化研究的一次有益尝试。另一方面,将动态非负矩阵分解的方法应用于技术主题演化,并在建模时即考虑到时间因素,把时间作为变量融入到模型中,使得模型能够反映技术主题演化的动态特征。
其他文献
期刊
在我国建设小康社会的过程中,党和国家领导人对民生问题给予了高度重视。由国家档案局下发的《关于加强民生档案工作的意见》首先提出了“民生档案”一词,对我国的档案工作提
学位
图书馆员作为图书馆要素的重要组成部分,其能力和素质直接影响到图书馆的工作绩效和读者的满意度。图书馆员职业准入制度的建立,将从源头上控制净化图书馆队伍,确保了图书馆员专
信息社会中,信息素养的重要性逐渐被人们所认可。信息素养教育成为实现终身学习的最重要的途径之一。随着计算机技术和网络技术的发展,信息素养教育走上了在线发展的道路。高校
我国电子政务经过十几年的发展,取得了长足的进步,电子政务的外包服务市场逐步形成,并在我国的电子政务建设工作中起到越来越大的作用。如何在全国范围内更加有效地推广电子
学位
用计算机管理档案离不开档案管理软件的开发与应用,在档案信息化过程中,档案管理软件扮演着重要的角色。从20世界80年代初至今,档案管理软件也经历了近30年的发展历史。  
学位
语义wiki是语义网与传统wiki的结合,通过结构化的知识表示和知识处理对传统wiki进行扩展,并以此解决传统wiki的信息过载问题。目前,语义wiki已成为国内外学者关注的研究热点。本
高校档案工作是高校管理的基础部分,它的管理水平对高校的教育水平、整体管理水平的提高发挥着越来越重要的作用。高校档案保管期限表是高校档案鉴定工作的具体操作标准,是确
学位
期刊
公共图书馆的总分馆制起源于西方国家,是一种颇为成熟的管理体制,在众多发达国家和地区普遍推行,该模式可以有效提高地区信息资源共享程度、统一服务质量、方便读者等。而囿于行