论文部分内容阅读
近年来,本体这个概念在智能信息集成、Internet信息检索、知识管理、语义Web、数字图书馆等众多领域广为流传。本体之所以能够流行的一个主要原因是由于本体提供了人与计算机之间以及机器与机器之间对领域知识的共享和共同的理解。于是,用于领域本体获取的机器学习模型或称“本体学习”近年来成为一个非常热门的研究方向。
从认知的观点看,目前的本体学习主要集中在概念获取、公理获取、关系获取等层面。确切地说,上述的本体学习算法应该被称为本体挖掘算法,因为在本体形成阶段的工作仍然是手工的或半自动的,需要人利用本体构建工具参与本体形成的过程,其主要的原因在于对本体学习过程中学习者的认知状态及其变化过程缺乏深入的研究。
要深入地研究本体学习,就要研究学习者的认知状态及其在学习过程中的变化。认知科学研究的一些成果说明和解释了人在完成认知活动时是如何进行信息加工的。有鉴于此,结合现代认知主义学习理论的成果,本文提出了本体学习的认知模型,用来描述本体学习过程中学习者的认知状态及其变化,并用形式化的方法来表示该模型中的知识,对已学习的知识进行归纳泛化,对矛盾知识的修正以及对过时的知识进行更新等认知策略的具体操作,从而进一步建立本体自动学习的认知模型,探索本体自动构建的关键过程和技术。
本文的主要结果如下:
1.在综合机器学习理论与认知主义学习理论的基础上,提出了本体学习的认知模型,并给出了其形式化表示。在该模型中,把本体学习过程看作是一个认知过程,通过7种不同的认知策略来实现,即:断言获得、本体扩展、本体减缩、本体归纳、本体演绎、本体修正和本体更新。本文讨论了除断言获得策略以外的6种策略。
2.为进一步讨论本体学习认知模型的实现,基于本体系统的本体论假定,建立了本体知识表示模型,给出了本体的形式定义,提出了本体系统的描述语言和推理规则,定义了本体的协调性及其逻辑闭包的协调性。
3.在本体知识表示模型的基础上,建立了基于公理化认知模型的本体学习系统。用公理化的方法为学习模型中的5个认知操作:本体扩展“+”、本体减缩“-”、本体归纳“(r)”,本体修正“°”和本体更新“◇”建立了相关的假定、公理体系,给出了操作的具体算子,并证明这些算子满足所建立的公理系统。
4.讨论了本体学习的认知模型中归纳算子、修正算子和更新算子中存在的问题及可能的解决方法。从修正与更新的最小改变原则的要求出发,提出了从类结构差异和类的差异两个层次进行本体比较的算法。