面向法律公文语义检索的元数据及其应用研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:jumglezhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展及各种电子文献资料的普及,高效的信息组织管理和检索成为信息资源利用的关键问题。而目前较成熟的信息检索工具和搜索引擎大多是基于检索提问式关键词匹配技术,检索中常常出现的两类主要问题:一是“信息过载”,二是“内容不匹配”,检索出来的大量非机器理解的、不规范的结果信息不仅不能满足用户需求、难以被共享和利用,而且造成了堆积如山“网络垃圾”,这种状况在法律领域同样如此。在司法实践中,法律决策者在查询目标不很明确的状况下选择决策依据时,注重的是如何从浩如烟海的信息中快速地调出与案件相关的法律条文、法规、判例和案例,以便提高法学研究或司法判决的准确度和综合分析能力。  为了较好地解决司法信息检索中存在的问题,本文通过对国内外语义Web技术和元数据研究,提出了构建基于本体的、面向司法案例的法律信息语义检索元数据的设计思想,并在以下几个相关方面开展了较深入的研究,重点做了如下工作:  1.以实现网页信息语义检索为目标,对现行反映司法案例及法律事实的法律文档信息(法律公文)进行特征分析和语义描述,抽象出可以用元数据表示的概念模型。  2.依据国际通用的都柏林DC元数据和其它应用领域元数据标准,构建便于计算机标识的法律信息资源的元数据(包括基本元素集及其扩展)。  3.借助本体和案例方法进行法律领域知识的组织,按照现行颁布实施的法律信息分类标准,编制了一套用于本研究模型系统实现的法律信息主题词表模板,规范其中各词汇间的层次、属性、特征关系,并对其进行编码。  4.采用一个原型系统,对本文所构造的法律元数据和主题词表进行了语义检索的模拟实现,初步达到预期的效果。  通过上述研究工作,在面向司法案例的数据组织、信息标识、语义抽取、元数据建模等方面摸索了一定的经验,为法律领域的知识管理和信息检索提供了可借鉴的参考依据。
其他文献
在装配序列的自动规划中,尤其是对于存在大量可行装配序列的复杂装配,装配序列的紧凑表示是装配序列评价与优化的必要条件,然而传统的装配序列表示方法,要么受组合复杂性影响
知识的文本挖掘(KAT)是当今计算机领域的一个很重要的研究课题。在本文中,给出了基于本体从海量网页文本库中获取领域知识的方法。首先,介绍了本体的基本概念与背景知识。对当
随着计算机技术和仿真技术的不断发展,虚拟现实技术在军事领域的应用变得越来越广泛深入。三维视景仿真作为虚拟现实技术的一个重要分支,国内外学者对其进行了大量的研究,取得了
随着网络技术的发展和信息社会的到来,密码技术的应用已不在局限于国防军事等重要领域,它已与普通人的生活息息相关。本文主要研究了如何提高密码软件质量和可靠性的技术,确保密
学位
该文对二维平面和三维空间限定Delaunay三角剖分进行了系统的研究,给出了可以在任意点、线段和平面片的限定条件下完成限定Delaunay三角剖分的算法,同时给出了限定Delaunay三
事务处理技术是保证信息可靠性和一致性的重要技术。分布事务处理中间件为开发、部署、监控和管理基于三层结构的联机事务处理应用系统构建了一个基础平台,在构筑基于事务处
随着XML技术应用的日益广泛,特别是在各类的Web应用中扮演着越来越重要的角色,XML文档和数据呈指数增长,如何管理、存储和检索这些XML数据,成为当前数据存储技术领域研究的一个热
数据流中数据是连续不断、无界、速度变化且以一种序列形式到达的。传统数据库管理系统和数据流管理系统(DSMS)之间的主要区别是前者假设每一个关系都存放在硬盘上且每个关系
数据挖掘,又称数据库中的知识发现,是指从大型数据库或数据仓库中提取隐含的、事先未知的、潜在有用的信息或模式。它融合了数据库、人工智能、机器学习和统计学等多个领域的理
博客的出现,使互联网从“信息共享”过渡到“知识共享”,而目前高校教师的教学方式又存在种种弊端,亟待创新和突破瓶颈。基于博客的教学知识管理系统,越来越受到教育工作者的关注