一种多维数据的离群点检测算法

来源 :第十一届全国企业信息化与工业工程学术会议 | 被引量 : 0次 | 上传用户:hongxing35
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的离群点检测算法大多对于低维数据的检测是有效的,且只能发现离群点,而不能对其含义进行解释。 本文提出了一种多维数据的离群点检测算法,该算法中离群点的定义是基于主次属性的。该算法首先使用k-均值聚类算法,将数据集划分成子数据块,在每个子数据块中根据基于主次属性的离群点的定义来识别出离群点,并能判定是否是噪声。该定义体现了“局部”的概念,所以能很好地解释离群点的含义。最后通过仿真实验说明该算法对多维数据的离群点检测是高效的。
其他文献
中央文化教育委员会学术名詞统一工作委员会公佈商务印书馆出版在中央文化教育委員會學術名詞統一工作委員會领導下已經編訂審查並公佈出版了自然科學中不少部門的名詞,近來
招远市主要鼠种为褐家鼠 ,其次为小家鼠和黑线姬鼠。年平均密度灭鼠前为 1 0 8% ,灭鼠后为0 81%。鼠密度控制在 [(87)中爱卫字第 1号 ]标准之内 Zhaoyuan main rat species
社会网络分析是为组织制定知识管理的措施提供定量分析的一种手段。在知识团队中处于不同位置的行动者享有相应的知识权力。本文依托社会网络分析,构建了基于SNA的知识权力中
目的 探讨马钱子总碱对兔膝骨Hulth-Telhag关节炎模型的作用及机制.方法 新西兰兔随机分为正常对照组,模型组,假手术组,马钱子总碱高、中、低剂量组,玻璃酸钠组,每组8只.除正
目的 观察中药导致肝损伤(herb-induced liver injury,HILl)临床特征.方法 回顾性分析2009年1月-2014年1月解放军第302医院595例HILl住院患者一般情况、用药史、临床表现、生
本书是「矿产普查勘探丛书」的一个分册,共分八章,约十六万字。第一章是对石灰岩的成份、分类、成因及其各种性质等作一般性的介绍。作者列举各种碳酸盐岩石的分类,并从实用
<正>中西医结合事业最早应追溯到毛泽东主席上个世纪50年代的一系列指示,他最重要的两句话给我影响最为深刻。1953年12月他对当时卫生部领导讲到:"我们中国如果说有东西贡献
一八月三十日晚上,在巴黎波旁宫半圆形的会场里,六百多名法国国民议会议员对一个关系着法国的命运和安全的问题进行了抉择。这个问题就是:法国将来是要作为一个独立的国家自
回顾中国在过去70年中西医结合(或称综合医学)的发展成果及经验,本文旨在回顾香港中医药及中西医结合的最新状况并探讨未来发展方向。1跨学科的科学在过去数十年间,跨学科科
期刊
@@
美國國務卿杜勒斯五月二十五日在華盛頓的記者招待會上厚顔無恥地表示:美國打算根據所謂「加拉加斯宣言」,糾集其他拉丁美洲國家對危地馬拉進行公開干涉.這裏提到的「加拉加