论文部分内容阅读
在当代国际社会,科技创新已经成为决定一个国家在复杂的国际竞争环境里繁荣富强、取得进步以及获取成功的关键因素。对于我国建设创新型国家、推进中国特色国家创新体系建设,早日实现伟大复兴的中国梦具有重要的战略意义;如何快速、准确地从科技文本中识别出科技创新路径促进领域科技创新,成为当前情报学研究热点之一。 在科技创新路径识别领域,主要有引文分析方法、文本内容分析方法和引文内容分析方法等,广泛应用于识别不同学科领域的科技创新路径,研判科技发展走势。但是,引文分析方法忽略了文献的文本内容;文本内容分析方法虽然深入文本内容,却欠缺了天然引文路径;引文内容分析方法存在数据格式机读性差、操作笨重等问题;随着全文可获取数据库的发展,使得深入引文内容进行主题表征、增强引文网络信息展示和理解等成为可能,能够在一定程度上弥补原有方法的不足。 本文以欧洲生命科学全文数据库(EuropePMC)抗衰老领域的文献作为数据源,综合运用引文内容抽取、主题识别和可视化分析等技术,识别出能体现科学知识创造和发展的科技创新路径。主要研究了:(1)基于引文内容分析的主题表征研究。首先,抽取出引文内容和位置等数据,然后利用TF-IDF、C-value、两种方法分别对引文内容进行了主题识别并综合各自优势得出最终主题表征内容,利用PLDA的方法对2010-2016年的引文内容分时间段进行主题识别和结果解读。(2)基于引文内容分析的科技创新路径识别及可视化研究。创建了基于引文内容主题演化的科技创新路径和基于引文网络主题增强的科技创新路径两种可视化图谱以呈现科技发展路线和预测分析前沿科技走向。 研究结果表明,本文提出基于引文内容分析的科技创新路径识别方法可以有效的识别出抗衰老领域科技创新路径,有助于准确地分析该领域科学知识创造和发展的过程,可以为科技决策提供信息依据,促进相关领域加速科技创新。但本文仅利用了期刊引文网络,今后将从不同数据源角度进行多维度科技创新路径研究。