基于双向距离关联和径向基神经网络的属性约简算法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:zhq198709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会数据量的日益增加,人们迫切需要有效的数据挖掘来发现其中的知识。数据挖掘的好坏不仅决定于挖掘的算法有效性,更决定于待挖掘数据的质量。数据预处理可以为数据挖掘提供高质量输入数据,是能够挖掘出有用知识的前提。属性约简是目前数据预处理研究的热点之一。本文针对目前多数属性约简算法只适用于分类输出的局限性,采用启发式属性过滤和学习算法融合验证的打包思想,提出了一种基于双向距离关联法(BDDC)和径向基网络(RBNN)的属性约简算法。算法用本文提出的双向距离关联方法对属性进行重要性评价,根据重要性排序使用改进的加减结合策略进行属性子集选择;然后采用径向基神经网络对已选出的子集进行第二层监督验证。最后,本文采用采用中国城市竞争力数据库及城市气候库对算法的可行性和有效性进行了实验验证。相对于输入输出关联法,基于BDDC和RBNN的属性约简算法具有以下改进:算法提出的BDDC属性重要性度量方法综合考虑纵向和横向输入输出关联,分别针对分类和拟合数据设计了不同的度量函数,而且纵向关联综合考虑到纵向输入输出变化的大小及方向,横向关联计算了输入输出的直接横向因果联系,兼顾了属性的不平等性。算法采用局部逼近的径向基网络(RBNN)作为选择验证工具,并根据数据特点设计了不同的网络输出,网络的学习采用聚类、梯度法与正交最小二乘法三者的选择式混合学习算法。算法在BDDC重要性排序和网络性能函数的双重监督下,采用改进的加减结合策略(IASCS)选择属性子集,提高了效率。
其他文献
科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交叉学科,是数学及计算机应用于高科技领域的必不可少的纽带和工具。高性能计算机的研制水平和实际应用水平
学位
学位
自动人脸识别的研究有着重要的学术价值和广泛的应用前景。本文沿着统计学习与融合的思路对人脸识别中的对齐、特征表达和分类器的训练及构造三个关键问题进行了深入的研究。
软件测试的开销在整个软件开发过程中占有重大的比例,提高软件测试的效率、降低测试的开销,对降低软件成本具有重要作用。测试数据生成是软件测试之中一个占用大量资源的过程
随着网络技术发展,网络应用趋于语音、数据和视频融合,新一代VoIP技术在专网组网中得到普便推广。基于网络的语音通信比传统电话有费用少、节省带宽和业务灵活的优点。各企事业
多核与虚拟化的发展,数据规模的增长,以及新的计算模式的出现,对内存容量提出了不断增长的需求。然而,DRAM系统的扩展性却受到了封装、工艺和信号完整性问题的限制,尤其以信号完整
随着移动通信技术的快速发展,国内移动网络运营商也在加紧对3G网络的部署和运作。为了保证第三代移动通信系统中核心网(CN)的安全,防止外部Internet网络的攻击,以及保护移动终端
随着Internet迅速发展,网络软件平台已成为当今软件技术发展主流趋势和竞争焦点,其核心和关键是位于中间层的Web应用服务器。Web应用服务器是在Web计算环境下产生的一种新型中
学位
网格计算是分布式计算的一种,随着网格应用的发展,网格技术被逐渐应用到科学研究的各个领域中。网格计算资源共享的思想与生物信息计算环境Weblab“一站式”服务的思想不谋而合
本文对可扩展的应用服务器架构的设计与实现进行了研究。主要内容如下: (1)分析了容器、公共服务和底层通信的关系,提出了一种改善系统结构的解决方案,能便利系统的维护、更