基于CNMARC书目数据关联数据技术研究——对Extensible Catalog的应用与功能扩展

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:xiaodehuwei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要包括以下四个部分:   首先,本论文的第1~2章主要是介绍图书馆关联数据的研究背景,明确论文的研究目的和意义,阐述研究思路和方法;调研图书馆关联数据的国内外发展现状,确定论文所要研究的目标软件、特定数据类型以及预期研究目标;对文中所涉及到的概念和相关理论知识——包括MARC、关联数据、FRBR、RDA等——进行梳理。通过对瑞典、德国、美国等图书馆关联数据发展相对成熟的图情机构进行系统调研、流程梳理和工具试用,总结现有图书馆关联数据发展过程中存在的问题。   第二,本论文的第3章主要是详细介绍待优化系统平台eXtensible Catalog,包括软件框架、现有功能、优势劣势等。该软件由Drupal Toolkit、Metadata services Toolkit(MST)、OAI Toolkit和NCIP Toolkit四个工具包组成。笔者将主要针对MST进行优化扩展。现有MST仅支持西文编码的MARC和DC元数据,笔者希望在现有功能的基础上通过编写算法,使其能够支持中文MARC元数据,加快我国图书馆关联数据发展的步伐。   第三,本论文的主体部分是第4~6章。这三章分别讲述了笔者对eXtensible Catalog进行优化扩展的详细步骤。本文在现有MST的基础上扩展了三个功能:CNMARC的XML化(第4章)、CNMARC书目数据的预处理与转换(第5章)、CNMARC书目数据的关联数据发布(第6章)。CNMARC的XML化主要是通过编写算法实现ISO2709格式的MARC数据与MARCXML和marcXchange的转化。CNMARC书目数据的预处理包括删除原始CNMARC记录中可能出现的错误字段信息;将数据字段中的代码替换为词表术语,并将这些字段解析到9XX字段供用户访问;以及合并字段中的相似信息等。CNMARC的转换操作则是从MARC书目数据中选择有代表性的字段,并将这些字段和子字段与FRBR不同实体对应的XC Schema属性映射。CNMARC记录的关联化发布包括MARC关键字段的选择与抽取、MARC字段与XC Schema的关系映射、D2R系统配置、个性化Mapping文件生成以及外联关联数据集的分析比较等步骤。   最后,本论文的第7章是结语部分。在这部分笔者总结了本文的主要研究内容和不足之处,并对图书馆关联数据未来的发展前景和研究工作进行了展望。   论文正文约5.2万字,包括图30幅,表16个。
其他文献
云南少数民族有25种,每种少数民族均超过5000人,在悠久的历史长河里,云南少数民族形成了丰富的民族历史档案,包括云南民族原始历史档案、口述历史档案、文字历史档案、汉文历史档
通过对泛在信息环境的内涵分析,总结出泛在信息环境下个性化信息服务应满足知识化、载体多样性、情境感知性、用户适应性等新的挑战,并对当前的相关研究进行梳理。基于此,以信息
数字资源长期保存活动是为了有效、可靠保存有价值的数字信息资源,以保障未来数字资源的长期可获取性。提供数字资源的长期访问获取涉及到公共服务问题,而长期保存公共服务的开
指出高校图书馆微博存在定位不明确、内容主题混乱、实质内容缺乏等问题,若要从根本上解决上述问题,需确保高校图书馆微博具备信息服务、自我宣传、相互学习、建立联系四项基
情境创设应贯穿于整个数学教学过程,把学生的情感活动与实践活动联系起来,引导学生循序渐进、饶有兴趣地克服困难,在提出问题和解决问题的过程中获得教学方法,提高学生的数学思维
在科技全球化的趋势下,科研环境发生了巨大的变化。学术型社交网站作为虚拟科研环境的一个重要组成部分,为科研人员进行科研信息的交流和分享提供了新的途径,科研人员作为一个特
介绍OCLC建立的Worldcat云计算数字图书馆的设计思想及OCLC应用云计算技术整合图书馆资源和数字图书馆日常服务流程的方法,分析在云计算环境下Worldcat数字图书馆的服务层级
指出现有关联规则可视化模型在数字图书馆的书籍量多时会造成界面紊乱、难于显示整体信息等问题,通过对现有关联规则可视化模型的改进,提出基于菱形图的关联规则可视化模型。根
目的:  以国家相关远程诊疗项目建设规划为指导,结合国家两期远程医疗信息化建设项目成果和经验教训,依托现有技术的发展,特别是人口健康信息平台、云计算、物联网、视联网、
随着开放获取运动的发展,开放获取的内涵在不断扩展。自2004年以来,开放获取进入全面推广阶段,向着开放数据和开放教育的方向发展,开放教育资源是开放获取运动发展成果之一。在此