复杂数据信息的聚类方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:zqlyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据的复杂性,规模不断增加,对聚类算法的要求也越来越高。本文针对复杂数据信息的聚类算法做了相关的研究,一种复杂数据是高维数据,由于“维度灾难”的影响,传统算法不能对它做有效处理,另一种复杂数据为障碍空间下的数据,因为障碍物的存在会导致传统聚类算法的失效,所以对它的处理也很重要。首先为了解决高维数据的聚类问题,本文在主成分分析算法(principal component analysis,PCA)的基础上,对其降维后会使后续聚类算法精确度下降的问题,提出了一种新的特征空间概念,通过特征空间与信息熵的结合构建了新的降维标准,提出了更加适用于高维数据聚类的降维算法(entropy-PCA,EN-PCA),后针对降维后特征是原特征的线性组合而导致的可解释性变差以及输入不够灵活的问题,提出了基于岭回归的稀疏主成分算法(sparse principal component algorithm based on ridge regression,ESPCA),最后在降维数据的基础上,针对遗传算法聚类收敛速度慢等问题,对遗传算法的初始化、选择、交叉、变异等操作进行改进,提出了新的聚类算法(genetic k-means algorithm++,GKA++)。其次针对障碍空间下的数据聚类问题,本文的首要目标是解决障碍空间聚类算法的精确度不足,以及很少研究者关注的障碍物动态变化的聚类问题,对此提出了障碍静止情况下的聚类算法(cluster algorithm under the condition of static obstacles,STA_PI_OBGRID),其中包含了一系列定义和规则来增加聚类的精确性,后又提出了障碍增加情况下的聚类算法(cluster algorithm in the case of increased obstacles,DYN_OBGRID_ADD)、障碍减少情况下的聚类算法(cluster algorithm in the case of obstacle reduction,DYN_OBGRID_DE)和障碍移动情况下的聚类算法(cluster algorithm in the case of obstacle moving DYN_OBGRID_MV),静态障碍聚类算法增加了聚类结果的精确性,动态障碍算法增加了对此问题的聚类算法的全面性。针对以上算法,实验从障碍物静止和障碍物数量变化或者位置变化方面创建数据,经验证后算法无论在准确性上还是在效率上均具有良好的表现。
其他文献
规范化管理是提升检察保密工作质效的必由之路,笔者结合自身实践,从三个方面谈谈加强保密工作规范化管理的体会。$$ 一是构建立体化保密网络。加强对保密工作的组织领导。保
报纸
本文以生产率、极限切削宽度、加工精度及机床功率消耗为约束条件,以最低生产成本为目标函数,对车削用量进行了优化。采用了收敛效果较好的适用可行方向法。所讨论的工件细长
【正】 《九歌》的成因,是楚辞学者聚讼的一个老问题.这个问题不解决,对《九歌》作出比较正确的理解是有一定困难的.一、从性爱谈起《九歌》多涉性爱.东汉王逸的《楚辞章句》
L-精氨酸是一种半必需氨基酸,是人体多种重要机体组织代谢物的中间体,在医药和食品工业中具有十分广泛的用途。钝齿棒杆菌(Corynebacterium crenatum)AS1.542是我国研究者从
对大型固体火箭发动机浇铸装药的固化降温时间提出一种新的估算方法。该方法根据不稳定热传导方程计算装药内部各点温度分布和所需降温时间,由所需降温时间计算出对应的应力松
肥肝是采用人工强制填饲,使鹅、鸭的肝脏在短期内大量积贮脂肪等营养物质,体积迅速增大,形成比普通肝脏重5~6倍,甚至十几倍的肥肝.由于其质地细腻,味鲜而别具风味,越来越受到
多么壮丽的场面!广阔无垠的旷野上,一群狼踏着积雪寻找猎物。它们最常用的一种行进方式是单列行进,一匹接一匹。领头狼的体力消耗最大,作为开路先锋,它在松软的雪地上率先冲开一
介绍了金属与非金属筒形件搭接粘接的一种超声在线检测技术,它能在微机光实时地显示被检测构件沿圆周方向上粘合面积的彩色图象,并对构件整体粘接强度合格与否作出预报。工程实
【正】 生产力发展的动力问题,是哲学和经济学界长期争论的一个问题。近几年来,认为生产力内部矛盾才是生产力发展的动力的同志越来越多了。本文拟就这个观点谈点意见。一持
计算机及数控技术近十几年来已在各个行业和部门普及,用人单位对相关的操作人员需求也越来越大,这主要是因为我国数字化工业正在广泛应用,中职学校为适应企业"甩掉图板,用计算机绘图"的需求而普及计算机绘图的教学。二维平面绘图一般采用AutoCAD(以下简称CAD)软件教学,要求学生熟练掌握复杂零件图和简单装