【摘 要】
:
随着语料库技术的不断发展以及语料库管理系统的广泛应用,语料库中存储的数据量急剧增大。但目前大多数语料库系统所能做到的只是对语料库中已有的语料进行存取,人们通过这些
论文部分内容阅读
随着语料库技术的不断发展以及语料库管理系统的广泛应用,语料库中存储的数据量急剧增大。但目前大多数语料库系统所能做到的只是对语料库中已有的语料进行存取,人们通过这些语料所获得的信息量仅仅是整个语料库所包含的信息量的一部分,因为目前用于对这些语料库进行分析处理的工具很少,又有局限性。然而,隐藏在这些语料数据之后的更重要的信息还没有被挖掘出来。这些语料信息往往对语言学家以及自然语言处理有着重要的参考价值。目前山西大学管理学院构建的法律框架网络本体语料库系统,是一个基于本体的语料库,可以实现对法律框架本体的管理,并存储了大量本体的实例——生语料和标注后的熟语料。本文以此为基础对法律框架网络本体语料库的知识发现进行了研究。本文共分七章,第一章和第二章阐述知识发现的相关理论以及知识发现模型,按照知识发现的过程模型对语料库中的语料数据进行知识发现;第三章介绍法律框架网络本体语料库系统的构建,提出了系统构建的原则,探讨了系统的模型结构和数据库设计并介绍了系统的五大功能;第四章是本文的重点,阐述基于生语料的知识发现过程和方法,采用提取文本特征词、文本自动分类和文本相似度计算三种形式对生语料进行知识发现,并展示相关实验过程和结果;第五章也是本文的重点,阐述基于熟语料的知识发现,将生语料进行标注形成熟语料后,统计本体中框架、框架元素以及词元语义特征的使用情况并给出了实验和结论;第六章对系统的实现做了简单的介绍。在最后一章对系统进行总结并对今后的工作提出建议和展望。通过对法律框架网络本体语料库系统的知识发现研究,将有助于法律语言学以及自然语言处理更深入的研究,为今后的知识推理和知识问答系统奠定基础。
其他文献
该论文以辩证唯物主义和历史唯物主义为指导,在调研的基础上,充分运用民族史料学、档案学、信息学等学科理论和方法,对白族历史档案信息资源进行全面系统的发掘,充分揭示其价
从推进企业档案管理改革与发展的目的出发,该文分析和预测了企业档案管理的转变.基于档案管理要为企业经营与管理、企业的生存和发展服务这一出发点,在遵循档案工作规律的基
本文在对宁夏扬黄灌区的同心县河草沟村的调查取样基础上 ,通过对灌溉地土壤灌溉前后以及灌溉地土壤与非灌溉地土壤之间的比较 ,分析了扬黄灌溉后 ,灌区土壤在盐分含量、土壤颗粒组成、土壤养分和土壤微量元素含量等方面的变化 ,以及这些变化对土壤沙化、土壤盐渍化和土壤环境质量等的影响。结果表明 ,扬黄灌溉在一定程度上抑制了土壤沙化 ,改善了表层土壤的盐分状况 ,提高了土壤肥力 ,但并没有彻底消除土壤盐渍化的
在介绍并评价当前主要检索行为实验方法的基础上,引入美国Marvin Zelen教授的Zelen设计,综合已有检索行为实验方法的优缺点给出应用于网络用户信息检索行为实验的改进Zelen实
中文微博信息是具有特别保存价值的原生数字资源,其长期获取面临风险,保存机构必须采取措施保障其可以得到长期利用。目前中文微博信息保存相关的研究、实践缺失,亟待引起研究人
针对大学图书馆网络环境下学位论文提交与发布系统软件的选型问题,介绍已通过CALIS认证的四套学位论文提交与发布系统,并从论文提交、论文审核与编目、文档标准化制作、论文
知识管理是以信息科学、认知科学和管理科学为基础,并在知识经济的背景下产生的一种新型管理思想。目前知识管理已经成为很多学科的研究热点,同时也引起了图书情报学界的广泛重
概述开放课件资源的起源、特征,深入分析其对e-Learning的支撑作用;结合图书馆的发展现状与功能特征,阐明图书馆开展e-Learning服务的可行性,并从收集、整合、组织开放课件资
21世纪的今天,人类社会在经历了农业经济时代和工业经济时代之后,逐步迎来了一个崭新的时代——知识经济时代。这个全新的时代具有不同以往的鲜明特征。同时在这个时代中,企业面