【摘 要】
:
孤立点检测是数据挖掘的一个重要研究方向,随着其应用范围的不断扩大,传统的孤立点检测算法遇到了一个最大的障碍,不适应高维数据的特性。研究人员对此给出了几种解决方法,其
论文部分内容阅读
孤立点检测是数据挖掘的一个重要研究方向,随着其应用范围的不断扩大,传统的孤立点检测算法遇到了一个最大的障碍,不适应高维数据的特性。研究人员对此给出了几种解决方法,其中子空间挖掘是解决高维数据挖掘的一种有效方法。目前提出的子空间孤立点检测算法还存在很多问题,如算法的检测精度低,参数难以设置等。本文主要针对以上问题,对子空间孤立点检测算法进行了研究。首先,介绍了基于轴平行子空间的孤立点检测算法SOD,针对该算法中的两点不足,提出一种改进算法。一方面通过对每一维的聚集度进行量化,确定各维的参考价值,从而降低了算法结果对参数设定的敏感度。另一方面利用相对距离表示各点到中心值的偏离度,从而更利于不同密度子空间下的孤立点检测。其次,针对现实数据集中聚类个数的未知性,结合基尼熵提出一种基于基尼熵的相关子空间选择方法,并给出相关子空间孤立程度定义,在此基础上提出了基于相关子空间的孤立点检测算法RSOD。该算法降低了对数据集先验知识的要求,不受数据集中聚类个数的限制,无论数据集中包含一个或是多个聚类,算法均可以正确选择相关子空间,并有效检测出孤立点。最后,以四个数据集验证了所提算法的有效性,其中包括人工数据集和真实数据集。
其他文献
协议识别是进行有效的网络管理与控制的重要条件,由于新的P2P软件(以Skype,Emule,BitComet,迅雷为代表)开始使用加密协议和协议伪装等技术手段来防止被网管探测、识别、封堵,传统
世界视频设备市场已经进入从模拟设备向数字设备的转型期,这个为期十年的历史性转折将引发巨大的市场需求。与模拟技术相比,视频的数字化技术可以提高图像的清晰度和质量,并具有
ASON网络赋予了传统的光传送网前所未有的灵活性和扩展性,其代表的智能化已经成为下一代光网络的发展方向,近几年,WSON网络作为ASON网络对波长网络控制的延伸,在继承了其极高
网络规模和应用规模的不断扩大,使得IT资源数量剧增,分布也更加分散。面对越来越复杂的网络业务环境,如何对各种设备资源和各类分布式业务应用实施管理,成为目前IT系统管理面临的
处理器性能分析对于性能瓶颈定位、优化处理器体系结构、指导下一代处理器设计具有重要的意义。随着处理器体系结构的日益复杂,如何在有限的时间内快速有效地定位分析处理器的
本论文研究的主要内容为基于TMS320C6416的实时图像处理系统设计及视频编码算法。首先介绍了视频压缩编码的基本原理,在此基础上,深入研究了H.264的帧内预测编码技术。通过充分
信息化是实现中国科学院科研活动和管理工作现代化的战略举措,是提高中国科学院创新能力和国际竞争力的重要保障。高效便捷的e—Science资源共享和协同工作环境、基于ARP平台
城市规划是城市政府为达到城市发展目标而对城市建设进行的安排。传统的基于物理模型的城市规划存在着修改成本高、效率低等问题。虽然虚拟现实(VR)技术可以为设计人员提供真
个性化推荐系统(Recommender System)作为一种信息过滤的重要手段,是当前解决信息超载问题的非常有潜力的方法。其中,个性化推荐系统中的协同过滤推荐是迄今为止应用最广泛、
分布式服务具有高性能、一体化、知识生产、资源共享等技术优点,其结点异构自治、资源动态演化、任务分布协同,消除了网络中的资源孤岛和信息孤岛,被认为是第三代互联网技术。S0