论文部分内容阅读
针对目前科技项目管理工作中存在的难以识别发现真正的“小同行”评审专家的问题,满足科研管理部门对筛选熟悉项目研究主题的小同行评审专家的实际需求,对国内外专家识别方法进行归纳总结,分析了各种方法的原理、适用情况及优缺点。将研究目标聚焦于识别发现真正熟悉项目相关研究主题内容的小同行专家学者,设计科技项目小同行评审专家识别方法模型,利用中英文学术论文数据为专家知识证据材料,量化专家在各个研究主题上的研究深度,计算专家知识向量与项目文档主题向量的相似性得分,实现科技项目小同行评审专家的准确识别。 首先,借鉴空间向量模型方法,将小同行专家识别问题转化为测度两个向量之间的相似性问题,并针对空间向量的固有缺陷进行相应改进,设计科技项目小同行评审专家识别方法模型。模型主要包括数据处理、知识表示和相似性计算三个模块,其中在知识表示模块通过将多义词和同义词进行合并处理以及将主题词在文本中的位置信息引入主题词的权重计算过程等操作,对传统的空间向量模型进行改进;在相似性计算模块中根据研究的需要选取向量内积作为专家研究方向与项目主题相似性的测度指标。 然后,考虑到不同类型研究内容上的差异,从基础研究和应用研究两个角度出发,选取肿瘤学领域两个不同研究类型的973科技项目申请书为测试样例,分别利用基于传统空间向量模型方法、本研究所提改进空间向量模型方法以及基于国家科技专家库的专家识别方法进行小同行专家识别实验。 最后,设计结果评价方法体系,从查全率、查准率和排序合理性三个角度对小同行专家识别结果进行对比与评价。实验结果表明科技项目小同行评审专家识别方法,可以有效地避免基于专家库的同行专家识别方法具有的专家知识表示信息不充分、粒度粗、相似性程度不能量化比较、信息更新缓慢不能代表及时反映专家最新研究方向等问题,在一定程度上优化了传统向量模型固有的脱离上下文语境、忽略语义内容等缺陷,实现对真正熟悉评审科技研究项目主题内容的小同行评审专家的准确识别。