信息熵度量的离群数据挖掘算法

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:game00vergoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群数据挖掘是为了找出隐含在海量数据中相对稀疏而孤立的异常数据模式,但传统的离群数据挖掘方法受人为因素影响较大.通过引入基于信息熵的离群度量因子,给出一种离群数据挖掘新算法.该算法先利用信息熵计算每个数据对象的离群度量因子,然后通过离群度量因子来衡量每个对象的离群程度,进而检测离群数据,有效地消除了人为主观因素对离群检测的影响,并能很好地解释离群点的含义.最后,采用UCI和恒星光谱数据作为实验数据,通过对实验的分析,验证了该算法的可行性和有效性.
其他文献
近年来中国借助自身优势平台,大力发展加工贸易。包揽包括英美等第一梯队国家地区在内的大量订单,并以其为着手点,跻身全球范围内的制造业浪潮之中。数十年来,中国将禀赋优势发挥
目的:通过观察三步五法和常规推拿手法治疗退行性腰椎滑脱症的临床疗效,初步探讨三步五法的疗效依据和作用机理,为临床治疗退行性腰椎滑脱症提供一种安全、有效的治疗方法。
切实加强技工院校职业发展与就业指导,建立有效的机制,是当前技工院校急需研究和解决的重要课题。本文就如何构建"全程化"职业发展与就业指导体系,阐述了"全程化"职业发展与
<正>尽管引人瞩目的苏格兰独立公投以失败而告终,但是大不列颠及北爱尔兰联合王国是否能够维持目前的244820平方公里的本土面积却仍然是个巨大的问题。相比于主要因为文化心
21世纪以来,我国国民经济水平增长迅速,全国经济总量不断上升。作为金融市场重要组成部分的证券基金市场也获得长足的发展,无论是其规模、产品种类、基金数量都迅速膨胀,并且
基于目前安全管理效率低下问题,探讨安全与网络图集成进行安全控制的安全网络图构建理论,是在施工阶段进行安全管理的重要技术手段。借鉴施工进度网络图,阐述了建筑施工安全
以课程评价工作的实践为基础,分析了课程评价的意义、指导原则、标准、实施程序和结果运用等,并结合实践说明实施课程评价的具体过程,提出将原有以评价课程教学设计转化为评
目的:本课题依据中医病因学说模拟云南春燥环境,并结合病理学、现代免疫学等相关知识,通过观察云南春燥环境下小鼠气管和肺组织病理形态的变化以及气道分泌型免疫球蛋白A(sIg
目前我国企业采购与付款环节的内部控制还存在很多问题,如控制流程不尽合理,预算和价格机制控制不严格等。这些问题严重威胁着企业的内部控制,极易导致采购成本不合理,资金管
目的:以ALS-SOD1G93A转基因小鼠为实验对象,通过夹脊电针对小鼠生存期、发病时间和行为学的影响,并以BDNF为切入点,探讨夹脊电针对小鼠腰髓前角BDNF表达的影响,为夹脊电针治