论文部分内容阅读
智能化是信息检索发展的必然趋势,而智能化信息检索的实现必然要依赖于较为完备的语义知识资源。作为专业领域内的垂直搜索,农业信息检索所需专业知识相对有限、语义关系较为简单,其智能化应更易实现。本体作为知识表示和知识组织的重要方式,已成为当前的研究热点。目前的本体研究多关注概念术语及其静态关系的表示,较少考虑其动态语境下的语义关联;多停留在理论讨论和小规模实验阶段,较少面向具体实际应用。农业信息检索亟需面向实际应用的、完备表示农业领域概念及其静态语义关联与动态语境下语义关联的知识库作为有力的资源支撑,为其提供智能化因子。本文在HNC(Hierarchical Network of Concepts,概念层次网络)理论的基础上,在国家科技支撑计划——中文信息处理应用理论研究与知识库资源的开发中子课题“农业信息智能检索知识库建设”的研究背景下,将本体作为知识库构建的一种方式,对农业本体知识库构建过程中一系列相关问题展开探讨,完成对知识工程的实践总结和理论提升。
本研究主要内容有以下几个方面:⑴从实际应用出发详细分析了农业信息检索的知识需求,认为农业信息检索要实现智能化需要以下语义关联知识:包括上下位关系、同义(近义)关系、部分一整体关系等基本静态语义关联、农业领域特有的专业知识语义关联和动态语境语义关联。⑵在借鉴HNC语义网络对农业相关概念设计的基础上,建立起农业领域概念分类体系,将农业领域内的概念大致分为动植物、农业劳作、动植物活动状态、农用物资、农产品、农业环境、农业主体、病虫害、农业科技、农业经济10大类。⑶针对农业领域概念各个语义类别内部及语义类别之间的基本语义关联进行细致分析,认为农业领域概念语义类别之间的语义关联可以基本看做农业领域特有的专业语义关联,并将其定义为对象、内容、作用者、条件、工具、源流等6种关联类型。⑷以句群为单位,针对农业信息实际文本中的动态语境语义关联展开探讨,主要研究句群中的农业领域信息、农业对象和农业内容,探讨农业领域概念在动态语境中的语义关联。⑸具体介绍通过哪些途径来获取农业领域知识,确定哪些知识可以自动获得、哪些知识只能手工获取;并参照HNC知识表示方式,对这些知识进行形式化表示。同时从理论高度上就知识获取和知识形式化表示的部分问题展开了探讨。⑹总结农业本体知识库的具体建设情况及其特色之处,详细阐述了农业本体知识库对于检索请求的“理解”和对检索文本的“理解”的资源支撑作用。⑺在HNC现有知识表示体系的基础上展开对专业知识的获取和表示的相关研究。农业本体知识库不仅对农业领域概念的静态语义关联及其特有的专业知识语义关联进行了完备而简明的知识表示,而且将动态语境下的语义关联纳入其中。同时,对农业领域中的语境理解和语境生成问题进行了初步探讨,对语境的形式化表示进行了初步研究。