基于K均值和马田系统的聚类分析方法

来源 :统计与决策 | 被引量 : 0次 | 上传用户:zhfly6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统聚类方法采用欧氏距离作为测量尺度,变量间的相关性会造成聚类结果失真.文章提出了K均值和马田系统相结合的聚类方法.首先对所有数据进行K均值聚类,生成K个初始类;其次对每个初始类采用基于稳健马氏距离的异常值检测方法剔除异常值,构建K个稳健马氏空间;最后计算每个数据在K个稳健马氏空间上的马氏距离,将其划入具有最小马氏距离值的类中.数值实验结果表明该方法能显著提高K均值聚类结果,与已有方法比较也表现出良好的聚类效果.
其他文献
文章以减小检验犯第一类和第二类错误的概率为主要目标,在泊松过程强度函数存在尖点时修正渐进显著性检验.通过修正似然函数,建立修正极大似然检验和修正Wald检验,并将上述检
随着科学技术的发展,高维成分数据广泛出现在医学和经济学等领域且收集越来越方便,惩罚方法是解决高维数据变量选择问题的重要方法.目前关于成分数据变量选择的研究主要基于
为了更加准确地刻画时间序列的长记忆性和厚尾性,文章建立了带有分数布朗运动增量平方项的GARCH模型,分析了模型的统计性质,给出了模型平稳解和各阶矩存在的条件,对模型的尾
经济全球化背景下,世界经济整体性趋势显著增强,金融危机对各国经济发展的消极影响也被放大.从经济结构层面看,金融危机的出现与金融业过度自我膨胀、实体经济萎靡有关.各国
期刊
目前定量敏感问题所用调查方法需使用随机化装置从而需要在现场实施.为此,文章充分利用大数据资源作为辅助信息,将分层抽样方法与不需要随机化装置的技术结合,实施精度最高的
文章从群体效用和均衡效用的角度比较了多指标综合评价中的四种平均合成方法,并在此基础上提出了一种新的合成方法.实证分析结果显示:均衡效用对几何平均和调和平均具有正效
超高维数据判别分析的变量筛选是研究热点之一,样本比例不平衡会对变量筛选产生较大影响.文章从条件分布函数的标准化C-v-M距离出发,构建了基于最大类边际效用的特征筛选方法
Granger因果关系作为线性因果关系,计算非常简单、操作性较强,但是,线性关系并不能模拟变量之间所有的关系,变量之间可能存在其他更合适的模拟方式.文章借鉴灰色关联的思想,
作为一种全新的社会治理模式,合作治理的首要特征在于其是由多元行动者及其行动有机构成的,行动者之间的交往行动网络则是这一有机体的中枢神经系统。与个体可以直接使用判断—抉择—行动连续体开展决策与行动不同,包括个体和组织在内的多元行动者之间必须以交往网络为桥梁来实现抉择与行动之间的有机协调。基于这一逻辑,从行动主义路径进行开放探索发现,交往行动网络的建构存在(但不限于)3种可能选择:一是基于交往的流动性,建构合作交往网络的数据流、信息流和知识流体系;二是基于行动的灵活性,建构具有开放、有机和协调特性的交往行动体
“精致穷”作为一种青年人标榜自我的方式在最近几年悄然兴起,“精致穷”并不仅仅是一个简单的超前消费现象,而是关涉了更为复杂的社会和文化命题.中国当下的结构性富裕催生