基于免疫进化计算的数据聚类算法研究及其应用

来源 :西南大学 | 被引量 : 0次 | 上传用户:gxmvsgxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是近年来国际上在信息、决策领域最前沿和最活跃的研究方向之一。聚类就是把多个没有类别标记的样本集按某种准则划分成若干类,是数据挖掘中的一种强有力的分析工具,得到了人们的广泛关注,近几十年来得到了迅猛的发展,有许多聚类分析新算法不断被提出,并且聚类分析已广泛地应用于模式识别、计算机视觉、模糊控制、图象分割、特征提取和信号压缩等许多领域。本文主要对进化计算、人工免疫系统、混沌优化算法与模糊c-均值聚类(FCM)算法相结合的混合聚类算法进行了研究,提出了两种新算法:基于免疫进化计算的模糊c-均值聚类算法(IEFCMA)和基于混沌免疫进化计算的模糊c-均值聚类算法(CIEFCMA),以提高收敛速度并改善分类效果。第一,介绍了聚类、模糊聚类分析和模糊c-均值算法,指出模糊c-均值算法是模糊聚类分析中应用最广泛的,同时分析指出了模糊c-均值算法的致命缺点:对初始化非常敏感而易早熟陷入局部最优解。第二,本文对进化计算、人工免疫系统的基本框架、功能原理和特性进行了阐述,探讨了它们的优缺点,并介绍了免疫进化算法的研究现状。第三,本文介绍了混沌理论、Logistic混沌优化算子和Tent混沌优化算子,并指出混沌的遍历特性可作为搜索过程中避免陷入局部最优解且改善搜索效率的一种优化机制。第四,针对现有模糊c-均值算法存在的不足,本文提出了改进的新算法,新算法结合了人工免疫系统、进化计算和混沌优化算法、模糊c-均值算法各自在数据空间搜索的优势,实现了从全局到局部的两层领域搜索机制。新算法中介绍了聚类中心作为抗体的实数编码方式、克隆选择算子、免疫记忆、免疫遗忘、抗体浓度抑制、各种进化操作算子以及混沌优化算子。仿真结果表明,本文提出的改进模糊聚类分析的新思想和新方法都取得了良好的效果,新算法有效地避免了通常聚类方法易出现的未成熟收敛现象,同时也具有收敛速度快、分类准确度高、种群多样性好等特点。
其他文献
无线移动自组网(Ad Hoc networks)是一种新兴的网络技术,具有单独组网能力和自组织的特点,在军事、民用、灾害营救等领域具有广泛的应用前景,已成为当前无线通信领域研究的一
当前,精细农业、精准农业思想的提出为农业的发展开辟了新的空间。高新技术应用于农业生产对于降低农作物生产成本、增加农作物产量、提高农产品质量并在生产中减少对环境的
随着Internet的快速发展,因特网上信息数据量与日俱增,当人们利用搜索引擎检索关键词,面对其返回的一个庞大的相关网页链接列表时,常常还是难以寻找到自己真正所需的资源。解决该
本课题由上海市高校科技发展基金项目“储罐远程监控单元(RTU)”、上海师范大学科研成果产业化(中试)项目和上海师大青年基金项目“新型SCADA系统的研制和应用”立项和资助。
随着全球信息化脚步的不断加快,人们对信息的需求越来越具有高效性、灵活性、广泛性和综合化的特点。但随着IT技术发展的阶段性的特点,网络上存在大量的异构数据库如对数据属性
实体间语义关系抽取是信息抽取中的重要环节,目的是通过命名实体对的上下文来确定实体之间是否存在关系以及存在何种关系。目前实体间语义关系抽取研究的最大挑战是训练数据
随着Internet和移动通信技术的迅速发展,使用户随时随地通过移动终端上网成为可能。J2ME为嵌入式和移动应用开发提供了完美的解决方案。使用J2ME技术进行移动应用程序的开发
随着社会的进步和科学的发展,机器替代人工、电脑替代人脑也已经成为一种趋势和共识。因此,一切工作的自动化也就成为了人类的一个梦想,一直以来人们为了实现这个梦想而在不
随着计算机网络技术与多媒体技术的快速发展,数字产品的版权保护已经成为信息技术领域中最重要的问题之一。作为信息隐藏技术在计算机领域的一项重要应用,数字水印为保护多媒
序列联配以及序列二级结构联配是生物信息处理中最基本最重要的问题。自1970年Needleman和Wunsch提出的经典的动态规划算法以来,如何获得结果准确,时间空间效率更高的序列联