一种基于密度敏感的自适应谱聚类算法

来源 :数学的实践与认识 | 被引量 : 0次 | 上传用户:wston
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的谱聚类算法不适合处理多尺度问题,引入一种新的相似性度量—密度敏感的相似性度量,该度量可以放大不同高密度区域内数据点间距离,缩短同一高密度区域内数据点间距离,最终有效描述数据的实际聚类分布.本文引入特征间隙的概念,给出一种自动确定聚类数目的方法.数值实验验证本文所提的算法的可行性和有效性. Because traditional spectral clustering algorithms are not suitable for dealing with multi-scale problems, a new similarity measure-density-sensitive similarity measure is introduced, which can enlarge the distance between data points in different high-density areas and shorten the same high-density area The distance between the data points, and finally the effective description of the actual cluster distribution of data.This paper introduces the concept of feature gap, and gives a method to automatically determine the number of clusters.Numerical experiments verify the feasibility and effectiveness of the proposed algorithm.
其他文献
同步辐射波荡器光源相干性能逐步提高,使得同步辐射相干光学实验对理论模拟的要求越来越高.对同步辐射光束线空间相干性进行有效的评估,可以指导相干光束线的设计及其相干光
核工业的发展对环境造成了一定程度的铀污染,植物修复作为修复铀污染土壤的一种经济环保的方法得到广泛关注,而铀在土壤中的生物有效性是制约这一技术的关键.本文运用土壤浸
评价SPECT/CT同机融合图像在肺癌单发骨转移瘤定性诊断中的价值。选择196例全身骨显像表现为单发异常放射性核素分布的肺癌患者行骨病变部位CT扫描。由2名核医学科医师对全身
由于铀部件自发中子强度弱,特征γ射线能量较低,对密封容器中铀部件高置信度认证是当前军控核查研究中的一个难点和热点.本研究利用加速器定时DT中子源,通过高速数据采集系统
考虑到链子崖危岩体的变形受温度的影响较为明显,为此,将链子崖危岩体的变形看作时间和温度的函数,利用泰勒级数建立链子崖危岩体的变形与时间和温度的函数关系,并将泰勒级数的余项及时间变化的二次方和温度变化的二次方的系数的变化量看作数学期望为0的动态噪声,建立卡尔曼滤波模型,并用于链子崖危岩体变形的预测预报.实例计算表明,模型的拟合效果和预测效果较好.
电力负荷预测过程中,对于原始数据摆动较大,并且数据的整体变化是增大的趋势的序列,以往常采用包络模型来处理它.但是,由于很多不确定的因素的存在,使得上包络及下包络曲线及
投资者在投资决策中,对预期收益率的期望和投资在不同资产的比例要求存在一定的模糊性,建立模糊投资组合模型,对约束不要求严格满足,引入弹性参数(容差),给出容差的计算方法,
针对鲁皂水库正常蓄水位优选中各指标不相容问题,利用集对分析理论构建正常蓄水位优选模型,将参选水库正常蓄水位方案的多个指标合成为一个与标准评价集的优越度,用来描述水
在虚拟企业的组建过程中,伙伴选择的优化组合是最重要的管理过程,合理的伙伴组合可以使利益最大化.为了解决选择过程中信息不对称问题,本文在研究vague集的基础上,建立了适合
多工序制造过程在加工产品质量特征时出现的加工误差存在相互影响,因此为了保障产品的加工质量,定义了误差自修正能力指数来评价多工序制造过程对产品质量特征加工误差的补偿