论文部分内容阅读
随着互联网的发展及各种电子文献资料的普及,高效的信息组织管理和检索成为信息资源利用的关键问题。而目前较成熟的信息检索工具和搜索引擎大多是基于检索提问式关键词匹配技术,检索中常常出现的两类主要问题:一是“信息过载”,二是“内容不匹配”,检索出来的大量非机器理解的、不规范的结果信息不仅不能满足用户需求、难以被共享和利用,而且造成了堆积如山“网络垃圾”,这种状况在法律领域同样如此。在司法实践中,法律决策者在查询目标不很明确的状况下选择决策依据时,注重的是如何从浩如烟海的信息中快速地调出与案件相关的法律条文、法规、判例和案例,以便提高法学研究或司法判决的准确度和综合分析能力。 为了较好地解决司法信息检索中存在的问题,本文通过对国内外语义Web技术和元数据研究,提出了构建基于本体的、面向司法案例的法律信息语义检索元数据的设计思想,并在以下几个相关方面开展了较深入的研究,重点做了如下工作: 1.以实现网页信息语义检索为目标,对现行反映司法案例及法律事实的法律文档信息(法律公文)进行特征分析和语义描述,抽象出可以用元数据表示的概念模型。 2.依据国际通用的都柏林DC元数据和其它应用领域元数据标准,构建便于计算机标识的法律信息资源的元数据(包括基本元素集及其扩展)。 3.借助本体和案例方法进行法律领域知识的组织,按照现行颁布实施的法律信息分类标准,编制了一套用于本研究模型系统实现的法律信息主题词表模板,规范其中各词汇间的层次、属性、特征关系,并对其进行编码。 4.采用一个原型系统,对本文所构造的法律元数据和主题词表进行了语义检索的模拟实现,初步达到预期的效果。 通过上述研究工作,在面向司法案例的数据组织、信息标识、语义抽取、元数据建模等方面摸索了一定的经验,为法律领域的知识管理和信息检索提供了可借鉴的参考依据。