中文引文数据加工质量评价的研究与应用

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:wxf19860413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断普及,信息系统中的数据质量问题受到越来越多的关注,数据作为信息的载体,是影响决策重要性的基础元素,低劣的数据质量严重影响数据的传递、加工和反馈等过程,使决策无法正确地执行。   参考文献按一定的规则加工后就形成了引文数据。由于作者在撰写的论文、专著、期刊文献中并没有很好的贯彻实施参考文献国家标准GB7114规定的著录规则,这就造成了引文数据的杂乱无章。引文数据质量的优劣直接影响引文数据库的效能发挥,影响用户作为统计和评价工具用时的效果。因此,引文数据的质量控制非常的重要。数据质量评估是提高数据质量的基础和必要前提,它能对应用系统的整体或部分数据的质量状况给出一个合理的评估,从而可以帮助数据用户了解应用系统的数据质量水平,并采取相应的措施来提高数据质量。而引文加工又是影响引文数据质量的一个非常重要的方面,所以,本文主要针对中文引文数据加工质量进行分析,找出影响数据质量的因素,设计出质量评价模型,评价方法与算法,并用实例验证其可行性。   影响中文引文数据质量的因素很多,既有管理方面的因素,也有技术方面的因素。无论由哪个方面的因素造成的,其结果均表现在数据库中的数据没有达到预期的质量指标。本文主要从主观和客观两个因素对影响中文引文数据加工质量的基本要素进行分析,构建了中文引文数据加工质量的基本要素模型;通过层次分析法进行评价模型的设计;通过专家访谈、问卷调查、相关分析法等方法对评价指标体系进行设计,确定科学、合理的评价指标;通过加权平均法确定评价指标权重;通过理论研究和实例数据制定合理的抽取比例;通过实例验证,检验本文的研究成果是否适用。通过实例研究得出:小抽取样本中文引文数据的质量能够反映整体中文引文数据的质量情况,并验证了本文的评价模型,评价算法是适用的;通过对小于等于70分的评价指标进行分析,得出是由于加工人员的本身的知识、判断和理解能力等的不同而造成的,而不是加工生产线的问题;提出相应的措施和方法来提高中文引文数据的加工质量。
其他文献
近年来频发的突发事件给档案馆及馆藏档案带来极大威胁和损害,同时也给档案馆应急管理工作敲响了警钟,应对突发事件的应急管理工作越来越受到档案馆的重视。凡事预则立,档案
在网络医学健康信息用户剧增、网络医学健康信息对用户的影响加剧和网络医学健康信息用户群的变迁等背景下,如何根据用户需求为用户提供所需的服务、提高用户效率、减轻用户负
信息社会的高速发展为我国高校人力资源管理的变革带来了契机,它要求高校改变传统观念和模式下的人力资源管理,将信息技术融入人力资源管理过程中,推进人力资源管理信息化建设。
学位
[目的 /意义]科学化、规范化、定期化的图书馆战略规划对我国图书馆而言仍处于初始发展阶段,调查研究并吸收和借鉴国外图书馆战略规划的相关成果,将加快我国图书馆战略规划的
期刊
期刊