一种基于Web词项统计特征的领域本体演化方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:sinking521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着语义网的发展,本体越来越多地在各个领域被应用,使得本体演化开始受到越来越多的研究者重视。为本体提供一种有效的演化方法,使它能够及时地得到更新以适应各种变化成为本体工程研究领域和语义网研究领域的重要问题。 今天Web拥有的信息能够及时而全面地反映领域知识和领域知识变化,这无疑使它成为本体演化的理想驱动源。同时,Web信息的海量性使得本体演化所需要的新知识在其上呈现了许多统计特征,为发现本体演化的证据提供了有效途径。证据作为辅助决策的事物,为本体工程师判断如何演化本体提供了支持。正是基于这样的查看,本文提出了一种本体演化方法,它根据本体演化需要的新知识在Web上的统计特征,对Web词项进行统计以获得用于本体演化的证据,通过本体工程师对这些证据的分析来帮助决策如何演化本体进而更新本体。该方法将通过对Web词项进行统计而获得的用于本体演化决策的证据定义为H-词组。在分析过程中,根据本体工程师可以对所生成的H-词组进行反馈,然后计算机根据反馈重新生成H-词组,使得本体工程师能够指导计算机所进行的统计的方向,从而与计算机合作地进行本体演化分析。 为了验证该方法,我们在手机领域对它进行了实践。首先构建了一个领域本体,它包含了手机领域的基本概念,然后以此本体为基础,使用我们提出的方法对其进行演化,从中可以看出此方法的有效性,本文介绍了实践的过程。
其他文献
伴随着计算技术的发展,在实际应用需求的推动下,数值计算得到了长足进步。数值软件尤其是并行数值软件是当前数值计算应用的关键环节。日益增多的大规模、复杂实际应用问题,对数
XML(Extensible Markup Language,可扩展标记语言)是由万维网联盟(WorldWide Web Consortium,W3C)定义的一种标记语言,由于其跨平台、与软硬件无关的特性,目前已被广泛用于组织、
奥运信息系统作为大型信息系统是奥运会管理、支撑、运作的关键基础设施,是奥运会成功举办的主要因素之一。通过建立简明准确的模型是分析和设计奥运信息系统的关键。 奥运
嵌入式操作系统面向的应用领域十分复杂,这要求嵌入式操作系统具有可配置、可剪裁的能力。将基于构件的软件开发方法应用于嵌入式操作系统领域,不仅可以使嵌入式操作系统具有可
随着大规模网络存储系统的发展,基于P2P结构的存储体系由于可扩展性、健壮性以及性能的优势,越来越受到人们的重视。文件的可用性是存储系统最重要的属性之一,可用性水平的高低
垃圾邮件问题已经成为当今Internet的灾害。垃圾邮件是指那些未经收件人许可就发送到收件人邮箱的电子邮件。垃圾邮件每年都在造成大量的金钱损失、生产力浪费,并且造成Intern
随着工业控制、交通管理、环境监测、网络监测等各个领域中数据流应用的大量出现,数据流上的查询处理成为近年来研究的热点问题。这些应用中的数据通常来源于多个计算设备,形成
随着科学技术的不断进步,现在照相机的像素已经越来越高,普通的手机像素也已经高达千万级别,传统的对图像的处理已经无法满足用户的需求,特别是在颜色编辑方面,现有的方法对图像的
本文从电子设计自动化技术对研发流程的工程化、标准化要求入手研究电子设计自动化元件符号库的建库技术,总结了北京大学微处理器研究开发中心为建立规范、统一、标准化的元件
近年来集群系统已成为分布式计算领域研究的热点。随着集群规模的不断扩大和集群的共享化,作业管理在集群高性能计算中发挥着越来越重要的作用。针对大规模集群中的单节点瓶颈