论文部分内容阅读
书目数据是图书馆领域最具价值的信息资源之一,是图书馆服务的基础和核心,也是连接用户和图书馆的桥梁。但随着数字时代的来临和语义网的蓬勃发展,传统的书目格式已经无法满足用户的需求。在这一背景下,图书馆界开始试图在书目控制领域寻求突破,先后发布了FRBR和RDA,并最终于2016年4月正式发布BIBFRAME2.0。BIBFRAME是为图书馆重新设计和完成的新型书目框架,其本质是一个关联数据模型,并且一经提出就受到了图书馆界的广泛关注,世界上的主要国家都在积极推动新型书目框架的应用和实施。将传统MARC格式的书目数据转换为新型书目框架成为图书馆界面临的重大课题。而对于应用层次化编目的新型书目框架而言,层次识别就是转换过程中的关键问题。 本文在第2章首先梳理了国内外的理论和实践研究成果,包括新型书目框架的提出、关联数据领域的研究、书目数据关联化的实践以及书目数据层次识别算法的研究。通过调研发现书目控制领域一直在跟随时代的变化而不断发展,随着关联数据领域的不断成熟和书目数据关联化的广泛开展,新型书目框架的提出成为时代发展的必然趋势。层次识别作为书目数据向新型书目框架转换过程中的关键问题,目前国外包括联机计算机图书馆中心、美国国会图书馆和大英图书馆在内的很多机构都对该领域进行了相关研究,但国内仅有国家图书馆进行过类似研究,并且还存在自动化程度较低,需要较多人工干预的问题,针对中文书目数据的研究成果相对较少,还存在很大的研究空间。 继现状综述之后,本文在第3章进行了理论层面的研究,包括新型书目框架各层次的具体内涵、书目关系、识别要素以及与CNMARC字段的映射情况,为后续的层次识别算法设计与实验奠定了基础。首先,对新型书目框架的层次结构进行介绍,并分析了BIBFRAME与FRBR的层次结构对应关系。发现BIBFRAME继承了FRBR的书目世界观,新型书目框架的层次识别与FRBR化在本质上是相同的。其次,在结合具体实例的基础上,对各层次的书目关系进行了全面系统的分析,归纳出了各层次书目关系的基本类型。最后,根据对各层次书目关系的归纳,总结出了各层次的识别要素并建立了与CNMARC字段的映射关系。 在第4章,本文在理论研究的基础上进行了具体的实证研究。首先,从中国科学院联合目录中选取有代袁性的一部分数据进行层次识别实验,提出了适合中文书目数据的层次识别算法。其次,通过自动转换实验,验证了层次识别算法的有效性,算法准确率达到95.57%。最后,凝练和总结了实验的主要发现,包括算法的后续改进以及编目的后续建议。 在第5章,本文在上述层次识别相关研究的基础上总结了新型书目框架实施过程中面临的问题和挑战并提出了相应意见和建议。新型书目框架实施过程中面临的问题和挑战主要包括三部分,一是数据基础存在质量问题,二是相关采编人员的素质和技能有待提升,三是在新型书目框架的实施过程中,需要解决一系列问题,目前还没有成熟的解决方案。之后对新型书目框架的应用前景进行展望,分别从作品、责任者和主题三个角度考虑新型书目框架与扩展对象的关联。新型书目框架的关联扩展能够实现书目数据在互联网的共享,让图书馆走向开放和互联。 最后,第6章为结语,总结了本文的研究内容与成果,指出了研究的局限性以及后续研究的方向。 在本论文研究中,综合运用了文献调研、归纳总结和实验分析等研究方法。本研究探索提出的适合中文书目数据的层次识别算法为今后相关研究和实践提供了参考和借鉴。