基于引文索引的数据质量控制研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:haohaia9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学引文索引是从文献之间相互引证的关系上,揭示科学文献之间的内在联系。通过科学引文索引数据库的检索与查询,可以揭示已知理论和知识的应用、提高、发展和修正的过程,从一个重要侧面揭示学科研究与发展的基本走向;通过科学引文索引数据库的统计与分析,可以从定量的视角评价地区、机构、学科以及学者的科学研究水平,为人文社会科学事业发展与研究提供第一手资料。中国科学引文索引(CSSCI)循文献计量学规律,采取定量与定性评价相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊。CSSCI从来源文献和被引文献两个方面向研究人员提供相关研究领域的前沿信息和各学科学术研究发展的脉搏;提供地区、机构、学科、学者等多种类型的统计分析数据,从而为制定科学研究发展规划、科研政策提供科学合理的决策参考;为出版社与各学科著作的学术评价提供定量依据。   正因为引文分析具有如此重要的作用,所以引文索引数据库的数据质量问题就变得尤为的重要,引文索引的数据的质量将直接关系到引文索引系统的整体效率和权威性。在引文索引数据库的创建和管理过程中,常会出现各种各样的数据错误,这些错误都会不同程度的对基于引文索引数据的统计、分析、评价产生影响。   本文首先分析和归纳了引文索引数据库中常出现的一些错误,发现有些错误是原刊错误或作者疏忽造成的,有些是在录入的过程中造成的,有些是工作人员标引过程中造成的,等等其他原因;文章接下来分析了这些问题会对我们的统计分析产生怎样的影响,哪些错误会对结果没有影响,哪些错误又会对结果影响比较大;紧接着综合上面这两个方面,并且要尽可能的想利用计算机纠正这些错误,我们找出解决问题的思路和方法,理清思路之后我们就可以把这些思路和方法用到我们的实际工作中去;所以文章按照从录入系统,到数据库数据,到最后的数据统计这样的数据产生的过程,并考虑到每一步按照数据流程各自的特点,对数据质量控制提出了具体的实现方案,融入了数据字典,正则表达式等等一系列的工具,找到了一个计算机自动处理与人工维护相结合的数据质量控制方法,并在数据库建设和管理过程中收到良好的效果。
其他文献
以东莞构建城市图书馆服务体系的实施战略、实施过程和实施效果为例,探讨图书馆集群化管理的理论与总分馆制的实现方法,以期为正在发展的城市图书馆服务体系建设提供参考.
学术文献中蕴含了大量具有学术价值的核心知识点,对学术文献中的核心知识的抽取有利于学术知识的利用。本文针对学术文献的结构和语言使用的特征,提出了一套基于句法分析的文献
通过嘉定区图书馆作为上海市中心图书馆分馆在参与上海市中心图书馆建设过程中工作开展的情况,阐述作为城市区级图书馆在中心图书馆建设中如何依托中心图书馆网络体系,不断完
面对快速增长的文本信息,众多研究人员进行了大量基于文本内容的分析,生态治理技术领域情报分析在大数据环境下,也面临着从海量文本中获取特定内容的挑战,如科研人员需要获取生态
期刊
介绍图书馆学范式是对图书馆理论或实践的本质及其发展持有相同或相似观点/信念的一群研究者所共有的价值取向和话语特征;阐述依据不同的价值取向和话语特征,可以区分出不同
在探讨实施图书馆学本土化必要性的基础上,进一步阐释“本土化”与“中国图书馆具体实际”的内涵,即本土化实质是西方图书馆学基本原理与中国图书馆学、中国传统文化和中国实
研究目的 随着外购电子资源的不断增加,如何提高这些资源的利用率,如何使资源更有效地服务于读者,始终是公共图书馆最为关切的.作者结合项目实践经验,探讨了如何利用远程访问
在介绍我国开放存取理论研究和实践探索进展的基础上,从宏观环境、学术期刊出版机制、相关利益群体的协调、学术评价机制等方面对我国发展开放存取的优势及主要障碍进行剖析,
现代数字图书馆包含大量多语种信息。为了提高检索准确率,人们常常通过词典建立索引进行检索。但是许多亚洲语言缺乏这样的词典,也缺乏用于机器翻译的公开的电子辞典。本文评
学位