学习分类系统中的聚类问题的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:liongliong538
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学习分类系统是结合了进化计算和强化学习的一种机器学习技术,它是一种自适应的规则产生式系统,能够动态感应环境、模拟认知,利用环境反馈评估种群中的分类器(规则)并通过遗传算法对种群进行进化。经过三十多年的研究,学习分类系统已经发展成为一套成熟的理论框架和算法模型,并且已经在分类、强化学习问题、函数估计和预测等领域得到了成功的应用。另一方面,学习分类系统缺乏在无监督学习的聚类领域的应用。然而,基于遗传算法的聚类的有效应用和学习分类系统解决预测问题的思想给我们提供了使用学习分类系统解决聚类问题的思路。   本文在详细介绍学习分类系统当前研究的基础上,探讨如何基于学习分类系统有效并且有效率地解决聚类问题。主要的研究成果如下:   ●提出学习分类系统解决聚类问题的基本思路,设计出完整的基于复杂学习分类系统的聚类框架和详细算法。通过学习和进化,种群中的规则能够准确地描述数据的分类特点;应用规则约减算法得到一个精简的规则集合;最后使用规则合并算法合并同一个聚类的规则并判断每个数据归属于哪个聚类集合以得到最终的聚类结果。初步的实验结果验证了其在分离较好的复杂结构数据集上的聚类性能。   ●从学习分类系统中超矩形规则表示特点出发,参考CHAMELEON层次聚类算法,提出自底向上的规则合并算法。通过分析学习分类系统的进化过程,设计了加速进化机制。最后通过一系列不同大小和分布的数据集上的实验结果和对比数据验证了算法的有效性和高效性。  
其他文献
伴随着计算机技术的高速发展,数字图像处理成为了一门新兴学科,并且在生活中的各个领域得以广泛应用。图像边缘检测技术则是数字图像处理和计算机视觉等领域最重要的技术之一
程序的不变性(Immumbility)是指类的实例对象的状态在其生命周期内不会发生改变。分析程序的不变性主要有两种技术:一种是采用静态分析技术分析程序的类、属性和方法等,获得不
为实现林业信息化、提高林业现代化,国家林业部提出建设“数字林业”的构想。即利用3S技术和相关计算机技术,将林业的各种特征用数字化的形式表现出真实的林业状况。其中,林分景
随着现代大规模软件版本不断更迭,测试集的规模也变得庞大,软件测试的成本也随之上升。测试集约简技术则被考虑用来解决此类问题,它可以找到原测试集中规模更小的一个子集,且能满
随着微型机电系统(Micro-Electro-Mechanical System,MEMS)、无线通信、数字电子学等技术不断地发展,基于无线传感器网络(Wireless Sensor Network,WSN)的定位技术孕育而生。正
离群点检测是数据挖掘领域研究的重要问题之一,与其他数据挖掘研究的任务不同,离群点检测着力于从数据集中发现与其他数据显著不同的一小部分对象。目前离群点检测已经在许多领
三维网格分割(简称网格分割)的目标是采用计算机自动地将三维网格模型分割成为若干有意义的部件。但“有意义”本身并非良定义、可量化的概念,这是实现三维网格自动分割的困难
随着信息技术的发展,互联网信息不断增加,其中有很多有益的知识,也有很多有害的信息,如色情、恐怖主义等。对互联网信息进行管理是一个快速增长的的需求。   当前市场上存在很
随着计算机图形学的发展,需要对复杂场景渲染出极具真实感图像的应用越发增多。这就要求不仅要考虑来自光源的直接光照,还需要考虑来自其它物体表面因反射、折射等产生的非直接
21世纪,Internet经历了爆炸式发展,已经在人类生活中扮演着越来越重要的角色。Web应用不再仅仅是从前的展示静态信息的功能,而是要求具有实时、动态处理信息交互的功能。因此