论文部分内容阅读
科学引文索引是从文献之间相互引证的关系上,揭示科学文献之间的内在联系。通过科学引文索引数据库的检索与查询,可以揭示已知理论和知识的应用、提高、发展和修正的过程,从一个重要侧面揭示学科研究与发展的基本走向;通过科学引文索引数据库的统计与分析,可以从定量的视角评价地区、机构、学科以及学者的科学研究水平,为人文社会科学事业发展与研究提供第一手资料。中国科学引文索引(CSSCI)循文献计量学规律,采取定量与定性评价相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊。CSSCI从来源文献和被引文献两个方面向研究人员提供相关研究领域的前沿信息和各学科学术研究发展的脉搏;提供地区、机构、学科、学者等多种类型的统计分析数据,从而为制定科学研究发展规划、科研政策提供科学合理的决策参考;为出版社与各学科著作的学术评价提供定量依据。
正因为引文分析具有如此重要的作用,所以引文索引数据库的数据质量问题就变得尤为的重要,引文索引的数据的质量将直接关系到引文索引系统的整体效率和权威性。在引文索引数据库的创建和管理过程中,常会出现各种各样的数据错误,这些错误都会不同程度的对基于引文索引数据的统计、分析、评价产生影响。
本文首先分析和归纳了引文索引数据库中常出现的一些错误,发现有些错误是原刊错误或作者疏忽造成的,有些是在录入的过程中造成的,有些是工作人员标引过程中造成的,等等其他原因;文章接下来分析了这些问题会对我们的统计分析产生怎样的影响,哪些错误会对结果没有影响,哪些错误又会对结果影响比较大;紧接着综合上面这两个方面,并且要尽可能的想利用计算机纠正这些错误,我们找出解决问题的思路和方法,理清思路之后我们就可以把这些思路和方法用到我们的实际工作中去;所以文章按照从录入系统,到数据库数据,到最后的数据统计这样的数据产生的过程,并考虑到每一步按照数据流程各自的特点,对数据质量控制提出了具体的实现方案,融入了数据字典,正则表达式等等一系列的工具,找到了一个计算机自动处理与人工维护相结合的数据质量控制方法,并在数据库建设和管理过程中收到良好的效果。