论文部分内容阅读
科学、准确地揭示科学研究的内容及演化有助于及时发现科学前沿和研究热点、系统把握科学的发展态势,具有十分重要的意义。因科研论文作为科研产出所反映的科学结构具有一定的时滞性,而科学基金位于科技创新价值链的前端,是科研投入的重要实施手段,直观反映了国家在科学前沿的科研布局,也直接影响着科研产出。因此本研究选用科学基金项目数据,基于DTM动态主题演化模型进行科学演化方法体系构建,为科学基金主题演化分析提供新思路,并以具体领域进行实证分析,为科研管理和科技政策的制定提供决策参考支撑。 本研究在总结科学演化分析研究现状、主题演化模型研究现状的基础上,分析选择产生式文档模型中的动态主题模型DTM的优点以及适用性,将DTM动态主题模型引入情报学领域分析科学的演化及变迁。 构建基于动态主题模型DTM的科学演化分析方法体系,尝试动态提取科学领域主题,分析并总结其知识演化的规律,丰富科学演化分析方法。主要包括主题识别和主题演化分析方法研究两部分。主题识别部分,首先通过合并AlchemyAPI抽取的关键词构建适合特定语料的词袋;其次结合Kmeans++聚类系数、HDP主题概率方法初步估计主题数目,然后根据人工经验判断确定较为准确的主题数目;最后通过DTM模型构建,识别隐藏的动态主题。主题演化分析方法部分,主要从主题内容演化、主题热度演化、主题信息熵三部分分析主题随时间的变化轨迹,绘制基金主题演化图谱,进而展示主题的演化规律以及学科领域间的关联关系。 将方法应用到更能体现科学发展趋势的科学基金项目研究中,以美国国家科学基金会NSF中信息和智能系统(IIS)领域基金项目数据为例对本研究设计的方法体系进行实证研究,为科学基金主题演化分析研究提供新思路。通过绘制并分析主题关键词演化图谱、主题热度演化图谱、基金项目资助经费及资助强度演化图谱、主题信息熵图谱,并总结出科学基金项目主题演化三维图,对科学基金项目主题演化进行分析,有效揭示科学基金项目的主题演化。最后结合阅读相关文献报道、咨询领域专家,对本研究提出的分析结果进行了验证评价。