粗糙集理论及其在知识发现中的应用研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:davidjts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先介绍了粗糙集产生的背景以及粗糙集的一些基本概念,并将粗糙集与其他几种处理不确定性理论作了比较,同时对粗糙集的发展、知识发现以及粗糙应用于知识发现的优点作了概述.关于粗糙集的化理化刻画问题,为基于等价关系的粗糙集给出了另外两个公理组,公理组G和H.为扩展的的基于相似关系的粗糙集给出了一个化理组刻画,即公理组S.为扩展的基于自反、传递关系的粗糙集给出了一个公理组刻画,即公理组RT.对于所给出的四个公理组,证明了它们的可靠性和极小性.这些研究有助于粗糙集理论的完善和应用.关于粗糙集理论的拓展问题,将分子格引入到粗糙集理论,该文试图将近似算子作进一步抽象与推广.在分子格的框架下,通过多种方法对粗糙集理论进行拓展,包括:引入一个从格的分子到普通元素的映射,并通过此映射定义了抽象的上、下近似算子;定义了分子格上的辅助序,并通过辅助序定义了抽象的上、下近似算子;通过分子格的子格来定义抽象的近似算子;通过分子格的类拓扑子系统来定义抽象的近似算子;通过分子格的类拓扑子系统来定义抽象的近似算子;通过分子格的类闭包子系统来定义抽象的近似算子.对于这些拓展方法所构造的上、下近似算子,研究了它们的一些性质.在接下来的三章中,对粗糙集理论用于知识发现中的几个关键内容进行了研究,包括连续属性离散化、属性约简和决策规则获取.具体地,关于决策系统中连续属性离散化,从启发式方法和基于遗传算法的方法两个方面进行了研究.通过对初始断点集进行精简,将Nguyen S H提出的著名的离散化算法进行了改进,改进后的算法在空间复杂度和时间复杂度上都有较大程度地降低;另外,提出了一种遗传算法用于求解决策系统的离散化问题,它与启发式算法相比更能获得小且一致的离散化结果,为粗糙集中连续属性离散化提供了一种新的思想.对于决策系统属性约简问题,从信息论角度定义了一种新的属性重要性度量方法.与基于互信息增益的方法不同的是:这种度量方法不仅考虑了属性的值域的大小,而且还考虑了取值的分布.基于此度量,构造了相应的启发式算法,对多个数据集的实验结果表明该方法能更有效地对决策系统进行约简.另外,将遗传算法引入到决策系统的最小相对约简问题,设计了混合遗传算法,并采用了三种修正策略来构造修正算子,实验表明混合遗传算法能获得比启发式方法更好的结果.最后研究了决策规则的获得了,就一致性决策系统和不一致决策系统两个方面分别给出了相应的算法.对于处理一致的决策系统,给出了一种基于分类一致性的规则获取算法RICCR,它以条件属性子集的分类一致性来度量属性的重要性,并逐步将重要的属性加入.实验表明它能获取较少的规则,规则较为简单,且规则是自然按照强度由大到小排列,便于分类决策;另外,从对Monks数据集的实验可以看出所获得的规则有较好的预测分类能力.针对不一致决策系统,提出了一种修改的基于分类致性的规则获得算法,它首先采用粗糙集中比较普遍的方法,对每个决策类计算出相应的下近似集与上近似集,然后用决策类的下近似集获得确定性规则,上近似集获得取概率性规则.在规则获取时采用属性重要性方法,与LEM2相比,它能一次获得移多条规则.通过对Hayes数据集的实验表明了算法的有效性.
其他文献
随着人们对网络依赖性的增加,移动用户都希望能够以一种更加灵活的方式随时随地的访问企业网络资源和Internet资源.由于传统IP网络中大多采用网络前缀判断路由的方法,因此移
网络化已成为嵌入式系统发展的一大趋势,而通过Internet对嵌入式设备进行远程监控和管理则是嵌入式设备网络化技术的一大应用。嵌入式实时操作系统和嵌入式网络技术应用是非
随着Internet的快速发展,特别是WWW的飞速发展,网上信息资源越来越丰富,网络已经成为了一个全球最大的分布式的信息库,为信息共享、资源共享提供了一个良好的平台,是人们获得信息
随着用户对网络的安全性需求的不断提高,如何有效地进行网络管理为用户提供满意的服务成为业界研究的焦点。2004年8月王小云教授宣读了对MD5等算法破译的研究成果,使得SNMPv3
本文对虹膜及指纹图像基于整数小波变换的形态学零树压缩编码进行了研究。文章针对于虹膜及指纹的纹理特征,提出了虹膜及指纹图像基于整数小波变换的形态学零树压缩编码算法。
WebGIS应用中存在的主要问题之一是不能很好地解决大容量空间数据在网络中的处理和传输。有些WebGIS系统采用在客户端显示栅格图片的方法,此方法为了满足无极缩放显示的要求,
随着经济的全球化,市场的竞争越来越激烈,企业面临着缩短交货期、提高产品质量、降低成本和改进服务的压力,在这种环境下,供应链管理成为了近年来逐渐受到重视的一种新的管理
作为计算机科学、电子工程学、生物学的交叉学科,演化硬件结合了许多其他领域的知识,如EDA、复杂系统和自适应算法等.该文综述了当前演化硬件技术的进展,阐述了演化硬件的基
当今互联网中许多服务是基于C/S(Client/Server mode)模式,服务器往往成为攻击者攻击的主要目标。传统安全防护中,攻防双方处于不对称状态,攻强防弱,同时攻击活动对目标主机
随着网络和通信技术的发展,以软交换为核心的下一代网络NGN(NextGeneration Network)技术成为网络发展的必然趋势.作为NGN重点业务之一的VoIP(Voice over Internet Protocol)