基于量子谐振子模型的聚类算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:annazky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
量子谐振子模型是通过模拟量子谐振子波函数从高能级到基态的概率变化过程而形成的一种解决函数优化问题的优化算法。而包含K-means算法在内的基于划分的聚类算法形成的簇旨在优化一个目标准则,从函数优化的角度来看,就是求解目标函数的最优解。从这点而言,将量子谐振子模型应用于聚类问题的研究有一定的可行性。  基于此,本文提出了一种基于量子谐振子模型的聚类中心选取算法(ClusteringCenter Selecting Algorithm Based on Quantum Harmonic Oscillator Model,CCSA-QHOM),来解决初始中心点选择不当导致局部极值及在运算过程中不能自适应的确定聚类个数的问题。并在CCSA-QHOM算法的基础上设计了网格空间上的聚类算法——基于量子谐振子模型的聚类算法(CALMGD)。本文的创新点如下:  1)本文将实验室研究的量子谐振子模型应用于聚类问题的研究。  2)针对k-means算法需要事先确定聚类个数k和随机选择初始中心点可能导致聚类结果局部最优的情形,我们设计了一种采用量子谐振子模型来解决这两个问题的算法,该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数k并能够准确地定位到实际的聚合中心所在的局部区域。  3)设计的算法以网格空间为最小计算单元,在网格空间中采用高斯随机搜索的方式,从很大程度上提高了算法的效率。  此外,本文采用九个数据集进行结果测试并和其他聚类算法进行结果准确率和时间效率的比较。实验结果表明:CCSA-QHOM算法较适合于处理每个子类局部区域的网格密度分布呈单峰特性的数据集的聚类中心选择问题。且数据读入网格结构之后,算法的处理时间与数据集规模无关。通过与其他算法比较说明了CALMGD算法的聚类有效性和较好的时间效率。
其他文献
道路交通拥堵及其伴生的环境污染和安全问题已引起世界各国的广泛关注,成为影响经济和社会和谐发展的全球性问题。道路交通是一个由人、车、路和环境等诸多要素组成的系统,各种
学位
运算单元是高性能处理器芯片中的关键部件,在视频图像处理、无线通信、超算等领域,由于数据量并行性高,对数据运算的精度和实时性要求高,而且这些数据的处理中有大部分的加法操作
软件规模估算是软件项目管理的基础,其中软件功能规模估算是软件工程界研究的重点课题之一。COSMIC-FFP作为新一代的功能点规模估算方法,提供了更为灵活的软件模型和度量体系,因
电子病历的实施是医疗资讯发展的重要方向。由于本澳各医疗院所的资讯系统在建置过程中并未考虑到整合性、延伸性的问题,因此有许多限制的地方。例如院内医疗系统无法整合、跨
Internet正从一个主要用于交换和共享信息的网络演变成为一个开放的软件协同环境,像服务计算、普适计算、开放资源联盟(Open Resource Coalition)、网构软件等许多新型软件系
随着计算机科学、网络技术和通信技术的不断发展,多媒体技术也取得了很大的进步。现阶段,多媒体之间的同步问题成为了研究的热点。多媒体同步技术是多媒体关键技术,也是多媒体应
函数的支持向量估计方法被众多机器学习和模式识别研究者认为是现代机器学习最为成功的技术之一。支持向量机(SVM)试图在核诱导特征空间内寻找一个超平面,使得不同类别的数据
随着RDF数据集的规模和数量不断增大,传统方案基于三元组表将RDF数据导入关系数据库进行管理缺乏结构信息,无法有效利用数据库的索引、找到优化的执行路径,导致该方案查询效率低
随着计算机软件行业的迅速发展,软件功能规模度量在软件工程中的作用和重要性得到了越来越深刻的认识。功能规模度量(Functional size measurement,FSM)方法独立于物理组件和技
IP Multimedia Subsystem的出现使得电信业务能够方便的允许Internet接入,这将极大的扩展电信业务的用户群;另一方面,Web 2.0时代的到来使得Internet成为一个平台,Web用户不仅