论文部分内容阅读
量子谐振子模型是通过模拟量子谐振子波函数从高能级到基态的概率变化过程而形成的一种解决函数优化问题的优化算法。而包含K-means算法在内的基于划分的聚类算法形成的簇旨在优化一个目标准则,从函数优化的角度来看,就是求解目标函数的最优解。从这点而言,将量子谐振子模型应用于聚类问题的研究有一定的可行性。 基于此,本文提出了一种基于量子谐振子模型的聚类中心选取算法(ClusteringCenter Selecting Algorithm Based on Quantum Harmonic Oscillator Model,CCSA-QHOM),来解决初始中心点选择不当导致局部极值及在运算过程中不能自适应的确定聚类个数的问题。并在CCSA-QHOM算法的基础上设计了网格空间上的聚类算法——基于量子谐振子模型的聚类算法(CALMGD)。本文的创新点如下: 1)本文将实验室研究的量子谐振子模型应用于聚类问题的研究。 2)针对k-means算法需要事先确定聚类个数k和随机选择初始中心点可能导致聚类结果局部最优的情形,我们设计了一种采用量子谐振子模型来解决这两个问题的算法,该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数k并能够准确地定位到实际的聚合中心所在的局部区域。 3)设计的算法以网格空间为最小计算单元,在网格空间中采用高斯随机搜索的方式,从很大程度上提高了算法的效率。 此外,本文采用九个数据集进行结果测试并和其他聚类算法进行结果准确率和时间效率的比较。实验结果表明:CCSA-QHOM算法较适合于处理每个子类局部区域的网格密度分布呈单峰特性的数据集的聚类中心选择问题。且数据读入网格结构之后,算法的处理时间与数据集规模无关。通过与其他算法比较说明了CALMGD算法的聚类有效性和较好的时间效率。