形式概念分析上概念间的包含度理论研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:coolhongchacool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析是一种新的数据挖掘理论,它最早是由德国学者Wille提出的,它的核心数据结构是概念格结构模型。形式概念分析的思想主要来源于哲学,在哲学中,概念是由外延和内涵两部分组成的思想单元,而在形式概念分析中,概念的外延被理解为属于这个概念的所有对象的集合,内涵则被认为是所有这些对象所共有的特征集。概念和概念间的泛化和例化关系可以构成一个概念格,而与其相应的Hasse图则实现了概念格中概念及概念间层次关系的可视化。目前形式概念分析已被广泛地研究,并被应用到机器学习,软件工程和信息获取等领域。包含度是一种描述不确定性关系的有效的度量方法,它为不确定性推理提供了一个一般性原理。同时,它还便于进行信息的合成、传播和修正,特别地在各种关系数据库中有着直接的应用。关联规则是由R.Agrawal等人提出的,是当前数据挖掘研究的主要模式之一。它可以发现数据之间的联系,找出满足给定支持度和可信度阈值的依赖关系。本文主要对形式概念分析中的概念之间的包含度进行深入研究,并提出了一种利用概念之间的包含度进行关联规则提取的算法。所获研究成果不仅从理论上丰富和发展了形式概念分析,而且提升了形式概念分析在实际应用方面的探讨价值。本文获得了以下主要成果:(1)我们在形式概念分析的概念之间引入了包含度,并利用包含度理论描述了概念之间的量化关系,对概念格中概念之间的亚概念和超概念进行了刻画。本文的研究为从定量分析角度研究形式概念分析提供了新的依据,有利于对形式概念分析的进一步理解及扩展。(2)我们讨论了概念之间的包含度与关联规则的可信度之间的关系,进而提出了基于包含度的关联规则提取算法。由于生成的关联规则具有较高的冗余度,我们引入了φ最大关联概念和φ最大关联概念集的定义,给出了基于包含度的无冗余关联规则的提取算法,并通过实例验证了该算法的有效性。这为从形式背景上进行关联规则提取提供了一种新的途径。
其他文献
随着因特网的蓬勃发展,通过对网络资源的检索,已经成为人们获得信息最为方便的方式。当我们在现有的搜索引擎中输入关键词进行搜索的时候,得到的结果通常是成千上万的网页信息的
在不同的网络中路由分组广播信息,需要有路由器对分组广播的支持,由此产生了几个分组广播路由协议.这些分组广播路由协议都是针对不同的网络环境设计的,为了使分组广播包能够
该文论述了新疆吐哈油田建立井下工具实验站的总体设计以及系统中计算机控制系统的设计和实现.计算机技术的引入大大的提高了井下工具实验系统的准确性、可靠性和自动化程度.
该文总结了数据仓库多维数据模型的两种实现方式,介绍了DM Warehouse的体系结构,论述了系统增量式更新实例化视图的策略.在此基础上,文章着重围绕数据仓库一致性的两个重要
该文对监测网络这一特定领域的软件自动生成技术进行了研究.作为该技术研究的基础,抽象出一个两层次客户/服务器模型;提出一种监测网络软件自动生成技术,它分两步实现:一、程
术语抽取技术是信息处理领域的一项基础性课题,是自然语言处理领域的非常重要的子任务,在诸如自然语言的生成、句法分析、数据挖掘以及机器翻译、文本分类等很多领域都有广泛的
该文阐述了计算机数据库技术的发展历史以及应用广泛的关系数据库系统,对计算机网络技术发展过程中的三种网络计算模式做了分析比较.重点论述了基于客户/服务器的分布式数据
该文主要就机械加工企业生产经营管理信息系统的设计及实现方法进行了比较全面、系统的研究,提出了一套比较具体、实用、可操作的技术方案.在实现的技术方案中,该文还就机械
该课题是为了实现一个基于PC的同视频会议系统.该文对因特网上的声音质量的研究是该课题的成果之一.首先介绍了多媒体通信的发展历史及一般技术,描述动态系统的Petri网理论.
该文主要进行了基于先进的Internet/Intranet信息模型,面向大型软件研发单位的MIS的分析、设计的研究,及其在方正研究院管理信息系统(FRCMIS)中应用实现.首先,该文简要介绍了