论文部分内容阅读
本体是语义网的重要内容,目前Web上已发布有大量本体,本体数量的增加催生了本体复用的研究,本体复用问题又促使本体式样思想的产生及相关研究的发展。本体式样研究围绕基于本体式样的本体构建展开,涉及到本体式样的分类、创新、应用、评价等一系列子领域。
本研究从基于本体式样的本体构建方法的局限性出发,以内容本体设计式样为研究对象,以扩展内容本体设计式样的数量和领域范围、提高内容本体设计式样的质量为目标,对其构建和精炼方法进行优化,为基于本体式样的本体构建提供保障,论文主要从如下三方面展开研究。
优化基于非本体知识资源重组为内容本体设计式样的方法。研究扩展了可重组为内容本体设计式样的源知识资源的范围,首次将自然语言描述的知识资源用于内容本体设计式样重组。研究将论文中的图表作为重组资源,论述了图表重组为内容本体设计式样的依据,设计了图表重组为内容本体设计式样的总体框架;从图表的类型和表达知识的学术词汇出发选择基本符合内容本体设计式样特征需求的图表;并以辅以相似图表和来源文献为背景,对图表进行精炼;最后按图表揭示的语义化和概念化程度不同,分为语义图表和普通图表,在核心规则节点重组为概念,边重组为关系的基础上,制定重组细则,将图表重组为待精炼内容本体设计式样,最终归纳出一套完整的基于图表的内容本体设计式样重组方法。
优化复用本体资源抽取内容本体设计式样的方法。研究采用了基于聚类的方法,首先对已有的内容本体设计式样进行分析,总结其特征,确定要抽取的内容本体设计式样概念的数量范围及层次深度。然后以在多个本体中多次出现的概念为抽取起点,对与其相连的节点进行相似度计算,把相似的节点抽取出来,组成内容本体设计式样,这一方法加快了从现存本体中抽取内容本体设计式样的效率。
优化内容本体设计式样精炼的方法。面对内容本体设计式样精炼的全过程,设计了一套方法指南,指导经重组和抽取得到内容本体设计式样的修改、抽象等问题,提高内容本体设计式样的质量。方法分为五个主要步骤,研究设计了精炼流程,并对每一步给出了可操作性的方法说明,通过该方法的迭代使用,可大大提高内容本体设计式样的抽象程度和准确性。
方法的验证。运用优化后的方法,从图表重组来10个内容本体设计式样,从本体中抽取出来5个内容本体设计式样,运用精炼方法对其进行精炼。实验证明了这三个方法的可行性,通过该方法可加快内容本体设计式样构建的效率,增加内容本体设计式样的数量和覆盖范围和质量,满足基于式样的本体构建的需要。
论文最后对研究进行了回顾与总结,归纳了创新点和不足之处,并提出了后续研究的方向。