基于网格的聚类分析与可视化

来源 :天津大学 | 被引量 : 0次 | 上传用户:quyeliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据可视化技术是在大型数据库的应用中提出的新的数据分析与处理技术,已成为数据挖掘领域研究的热点。利用可视化技术能够更清晰的观察数据集的分布结构,了解数据之间的相互关系,使用户加深对数据含义的理解,加快获取知识的速度。聚类分析作为数据可视化的基础,其目的是在无监督情况下帮助人们更好的理解和观察数据的自然分组或构造,识别数据的内在结构。本文以聚类分析为基础,对基于网格的聚类算法、聚类有效性指标以及聚类结果可视化三个方面,做了研究和分析。本文的主要贡献如下:(1)为了克服现有基于网格聚类算法参数敏感的缺点,提出了一种新的可以自动确定参数的基于网格的聚类算法。引入顶点比对思想到密集格的合并过程中,降低了传统的基于距离的合并方法的计算复杂度,并利用统计直方图和不同连接强度下网格的连接图形象化描述聚类结果。(2)基于网格算法对数据压缩的理论,提出了一种新的基于网格的OPTICS聚类算法,有效解决了OPTICS算法计算复杂度高、运算速度慢的问题。实验分析了算法处理各种数据集的有效性和鲁棒性。(3)提出了一种新的基于二阶差分的聚类有效性指标。应用类内离差的二阶差分代替经典聚类有效性指标Gap统计中零分布的参考数据集,改进了原来指标的实现方式,提高了指标的稳定性,并能够适应多种分布的数据集。并且,由于不需要确定合适的零分布参考集,从而节省了运行时间。(4)定义了一种新的基于网格算法的距离测度,来代替欧式距离(或其他距离)。利用新的距离测度计算两个聚类间的不相似性指标d(Ci,Cj),并以二阶差分为基础,改进了两个经典的聚类有效性指标,实验证明了新指标的有效性和稳定性。
其他文献
一个自动制造系统通常由计算机控制,利用有限的资源如机器人、自动小车(AGV)、缓冲器、机床等按照预先设定的工艺路线并行地生产加工不同类型的工件。这些并行加工进程对有限
本文针对两轮自平衡机器人运动平衡控制中涉及的重心调节、传感器滤波等问题进行了分析和研究,取得了如下研究成果: 第一:重心可调节两轮自平衡机器人的设计与研究。 本
作为机器人研究中的重要方面,机器人仿真技术始终是机器人领域的热点之一。机器人仿真综合了机器人、自动控制、计算机图形仿真、软件工程、网络通讯等多种技术,目前已广泛应
人类在享受现代化的无线通信方式带来便利的同时,也对无线通信技术提出更高的要求。尤其是应用于军事领域的无线通信设备,更是提出要具有电子对抗的能力。利用空间功率合成技
随着信息技术的快速发展,低压大电流变换器在计算机、通信等领域中得到广泛的应用。现在的低压大电流变换器大都采用隔离型BUCK变换器,为了降低变换器输入直流母线损耗和减小输入滤波器的体积,变换器的输入电压在不断的提高,而变换器的输出电压更低,输出电流更大,开关频率不断提高,因此传统的BUCK变换器已不能满足低压大电流变换器的要求。本文在分析国内外低压大电流变换器发展的基础上,通过对几种典型主电路拓扑的
原子发射光谱仪主要用于成分检测。激发源是其重要部件。电感耦合等离子体(Inductively Coupled Plasma, ICP)激发源因诸多优点得到广泛应用。激发源微型化对研发微型光谱仪至关重要。新型微型ICP激发源功耗、氩气消耗量、体积、重量仅为常压普通ICP激发源的数百分之一。因此,研究激发源参数优化具有较重要的应用前景。本文对各种原子发射光谱仪常用的火花、电弧、辉光等离子体、ICP等激
软件工程管理下的面向对象的软件设计开发技术已经得到了广泛的应用,面向对象技术的特点,使软件的开发更加高效、快捷和易于维护。设计模式是一系列软件开发设计的成熟经验,
氧化铝配料过程因受供矿来源不稳定、返回碱液和污水成分不确定、以及检测滞后等因素的影响,所得生料浆质量指标合格性差。为改善生料浆质量,需要从充满生料浆的满槽中挑选出
近年来,随着网络带宽、计算机处理能力和存储容量的迅速提高,以及各种视频信息处理技术的出现,视频监控进入了全数字化的网络时代。而由于Linux系统其稳定性与安全性以及成本
计算机和网络技术和发展,引发了控制领域深刻的技术变革,控制系统结构向网络化、开放性方向发展将是控制系统技术发展的潮流。工业以太网作为一种新兴、统一、快速发展的标准,已