基于LDA和word2vec的主题演化研究——以科学计量学领域为例

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:bye_bye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“双一流”高校评估工作的展开和推进,科学计量学在科研评价中的作用再一次展现。在科学计量学发展的这些年,不断深入促进研究内容和研究方法等的创新,研究主题也在动态变化。跟踪国际科学计量学研究主题,识别理清学科发展的演化脉络对于学者了解科学计量学国际研究进展动态,可有力支撑学科知识创新,并为科技创新用户提供前瞻性知识服务,对于促进科学知识有效吸收和转化,以及推动科学计量学的发展具有重要意义。
  本文从主题挖掘和主题关联的视角出发,综合应用深度学习、文本挖掘、可视化等理论与方法,提出基于LDA和word2vec的主题演化模型,重点解决了科学计量学领域主题挖掘、学科领域主题关联、学科主题演化建模和主题演化知识图谱等问题,展示了多主题的动态演化过程。论文主要工作如下:
  首先,从定义、类型、技术等入手,提出了学科主题演化构建的基本理论和技术;然后对5届ISSI会议文献从国家/地区、机构和作者三个角度探究科学计量学领域的宏观研究情况;在明确主题的含义之后,从语义信息丰富度和语义关联度量可行性两个方面考虑,把word2vec模型引入LDA主题模型,来改进和优化词汇之间的先后顺序和依赖性关系。最后将主题演化可视化生成主题演化桑基图,研究科学计量学发展的演化脉络和趋势。
  本文的结论有:基于ISSI会议对科学计量学领域的计量分析发现,我国继欧洲各国成为科学计量学领域研究的中坚力量;荷兰的莱顿大学、加拿大的蒙特利尔大学和中国大陆的武汉大学是发文量最多的3个机构;作者合作网络展示出学者们整体上良好的学术交流和合作关系。基于LDA和word2vec的科学计量学主题演化研究发现,近年来科学计量学指标研究、替代计量学和科技创新与专利研究三个方面的主题是科学计量学的热点主题;替代计量学兴起以及引文分析的发展是科学计量学领域中主题演化的主要路径,整个学科主题演化呈现出进化性、结构性和阶段性的特点;未来,科学计量学的研究整体上会向科学化、技术化和实用化的趋势发展。
其他文献
学位
学位
学位
学位
学位
随着信息时代的到来和智能手机的普及,信息泛滥使互联网用户每天接收到的信息良莠不齐,因而,信息甄别已经成为日常生活中常见且自然的行为。当前,十九大报告强调进一步实施“健康中国战略”谱写了健康中国的清晰蓝图,提升全民健康信息素养成为了亟待解决的问题,从大量健康信息中找到真信息,提升健康信息甄别能力是重中之重。为此,健康信息学研究成为图书情报界的研究热点之一,尤其是新冠肺炎疫情的发生,使得图书情报界的学
学位
学位
学位
学位
科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源,是信息时代传播速度最快、影响面最宽,开发利用潜力最大的科技资源,而现有的科学数据管理与欧美国家比还不够成熟,差距较大,为了更好的做好科学数据资源的组织与管理工作,促进科学数据共享,本文构建了基于中间件技术的科学数据资源的组织与管理框架,并用已有的地球科学数据做测试,实现了异构科学数据资源的统一检索。本文以科学数据理论、元数据理论为基础,