论文部分内容阅读
随着计算机技术的发展,数字文献资源成为科研人员开展研究的基础。当用户阅读到感兴趣的文献内容时,往往面临着查找相似文献或其它相关信息的问题,然而网络信息资源呈现爆炸式增长,如何将科研人员从海量信息中解脱出来,提供以知识内容的分析探索为主的知识发现服务成为数字图书馆的研究热点。本文结合关联数据可以访问多个分布式异构数据源的优势,以分析科技文献内容主题为基础,融汇与之相关的信息,建立主题关联服务,帮助用户扩展知识的同时为自己的问题找到解决方案。
本论文的研究工作主要包括以下几个方面:
首先,调研了关联数据和基于关联数据的关联参考服务相关研究现状,对所涉及的关键技术进行分析总结,指出相关技术的适用对象、存在的问题等,作为本论文的研究基础。
其次,针对用户感兴趣的文献内容并结合关联数据集已有本体,构建当前文本主题模型。以DBpedia本体和LCSH/SKOS为基础,经过主题词识别、主题词匹配、本体概念优化和主题模型生成四个阶段,形成以本体形式表达的当前文本主题模型。当前文本主题模型是发现获取关联数据相关信息的基础。
第三,结合关联数据资源描述特点,提出基于当前文本主题模型的关联数据发现获取方案,包括基于主题模型的概念搜索、基于本体相似度的信息搜索和基于关联关系的扩展搜索。通过这三种方法的结合能全面、准确地发现获取与当前文本同主题同类型的研究成果信息,同主题不同类型的研究人员、研究机构、研究项目、学术会议和学术期刊信息。
最后,论文借助相关工具设计实现一个实验环境,对本文提出的主题关联服务构建方法进行验证,分析技术的可行性、有效性以及存在的问题和下一步研究工作重点等。
综上,本论文分析并探讨了利用关联数据构建主题关联服务的技术路线、实现方案等,希望为相关研究和应用提供借鉴。