【摘 要】
:
随着行业信息的融合,数据量成指数级的增长,数据种类庞杂,传统的技术已无法从复杂的数据分布中快速且有效地挖掘有价值信息。聚类分析可在无先验知识的前提下根据数据间的相似性挖掘有效的信息,现已被广泛应用于图像处理、情报检索和大气污染等众多领域。但很多聚类算法在处理不同类型的数据集时,会面临识别复杂簇精确性不高的问题。本文从数据局部分布出发,以识别任意密度任意形状的簇、提高识别精确性为目的,通过使用互近邻
论文部分内容阅读
随着行业信息的融合,数据量成指数级的增长,数据种类庞杂,传统的技术已无法从复杂的数据分布中快速且有效地挖掘有价值信息。聚类分析可在无先验知识的前提下根据数据间的相似性挖掘有效的信息,现已被广泛应用于图像处理、情报检索和大气污染等众多领域。但很多聚类算法在处理不同类型的数据集时,会面临识别复杂簇精确性不高的问题。本文从数据局部分布出发,以识别任意密度任意形状的簇、提高识别精确性为目的,通过使用互近邻技术构建自适应局部密度,提出了两个聚类算法DBLCM和CDBTS。(1)DBLCM算法提出了新的局部中心度量来反映是否可根据数据点在空间中的局部分布将其划分到核心区域的程度,同时,还定义了基于互k近邻信息弥补的双向绝对距离。根据双向绝对距离与局部中心度量,数据点被划分到核心区域或边界区域。然后,将核心区域的点与它的互近邻中高密度点合并形成初始簇。接着,将边界区域的点加入到其最近邻点所在的初始簇,得到最终簇结构。为了验证算法的有效性,选用了六个代表性的对比算法与DBLCM分别在包含任意形状、任意密度的二维数据集和多维数据集上进行了测试,并对参数k的取值进行了分析。实验结果表明,相较六个对比算法,DBLCM能有效地检测出任意形状、任意密度的簇。(2)CDBTS算法首先用数据点的反向k近邻个数定义它的局部密度,然后基于三方策略将数据集划分为三个互不相交的区域,正区域、负区域和边界区域。对这三个区域分别采用不同的处理方式:对于正区域中的点,将它与其互近邻中高密度点合并形成簇主干;对于负区域中的点,判断其k近邻点是否在正区域内,若在,则该点用来扩充边界区域;对于边界区域中的点,将该点加入到最近邻点所在的簇主干中。与DBLCM相同,为验证算法的有效性,选用了七个代表性的对比算法与CDBTS分别在包含任意形状、任意密度的二维数据集和多维数据集上做了测试。另外,进行了灵敏性实验以验证算法在不平衡数据集中识别小簇的能力。实验结果表明,CDBTS算法相较于对比算法,识别任意形状、任意密度的簇的效果更好,而且对不平衡数据集的识别效果更佳。本研究提出的两个聚类算法在复杂分布的数据集中均能较准确地发现任意密度、任意形状的簇,且时间复杂度均为O(n·logn)。
其他文献
高速铁路作为当今重要的交通工具,其运行速度快,运输能力强,能够促进世界的经济发展。近年来,高速铁路的发展与建设更加迅速,但其消耗的能源数量十分庞大。据统计,运行时速为250km的CRH3型高速列车每小时的耗电量达到5000度左右。为解决高速列车运行时的能耗较大问题,本文主要做以下研究:(1)针对单质点列车模型在一些坡道变化频繁的线路中计算能耗误差较大的问题,在充分考虑高速列车运行线路复杂的条件下,
多机器人系统是机器人领域的重要方向之一,主要研究多个机器人通过合作方式完成单机器人难以完成任务的方法,如环境地图构建、搜救、巡逻、监控等。其中,多机器人巡逻的核心在于设计合适的算法,使多个机器人在给定的时间间隔内,能够实现对环境的覆盖,从而实现对给定区域的监视与保护。目前,多机器人巡逻算法主要分为集中式和分布式两类。在完成巡逻任务的过程中,这两类算法的主要区别在于集中式算法中每个机器人都具有其他机
校园信息化的实现,可将数据处理系统与基层数据产出端进行对接,分析出不同数据比对下的差异问题,进而为后续校园教育管理工作的开展提供数据支撑。基于此,本文以校园大数据预处理工序为切入点,对学生数据库建设及可视化的实现进行研究。
文章确定了离子交换树脂再生剂的关键性技术指标,从而实现了生产过程中的有效控制,进而保证离子交换树脂再生剂产品的质量安全。
水下仿生机器人作为一种新型的水下航行器,具有推进效率高、噪声低以及对环境扰动小等优点,因此得到了广泛研究。由于机器鱼动力学模型的高度非线性和流体动力学的不确定性,使得关于运动控制问题的研究始终是该领域的核心技术问题。本文以实验室两鳍推进仿生机器鱼为对象,研究在胸尾鳍协同推进模式下,提高机器鱼的运动控制精度,使机器鱼具备应对复杂环境能力的方法,具体内容如下:(1)结合实验数据,建立了二自由度胸鳍/柔
伴随新环境下互联网技术的不断发展,各式各样的网络攻击技术都出现了极大的转变,安全攻防形式出现了显著的转变,详细表现则是攻击日趋多样化、攻击覆盖范围相对较大等。当前所遭遇的挑战重点为下述几点:1)网络安全态势未能实现有效的感知;2)大规模的数据未能实现有效的处置;3)异常行为以及未知威胁未能有效察觉;4)安全管理欠缺标准化的协调机制;5)安全防护的灵活性不足、依靠人工提供支持;6)新的安全应用日趋封
随着传感器结束的发展和移动设备的普及,手机中的传感器时刻记录着人体的活动数据,对这些数据进行分析能够发现人体活动特征,具有重要的研究意义。人体活动识别研究目前以机器学习为主,传统的机器学习技术在特征提取的过程中依赖于人工进行特征提取,具有一定的局限性,准确率较低。深度学习方法在图像、自然语言处理等领域获得了很好的效果,在活动识别的相关研究较少,如何对人体活动模型结构进行优化以提高准确率是一个需要研
本文主要通过对传染病来进行大数据分析与可视化,实现了传染病疫情信息实时监控、各个地区的感染情况的数据可视化,让用户能够简单快速地掌握传染病疫情的各种数据,协助居民提高自我防护意识,做好传染病疫情防控工作。同时能加强政府部门对传染病疫情发展趋势的了解,为政府提供强有力的数据支持。
目的:探究冰片、薄荷脑、绿原酸及蛇床子素的体外抗炎作用,筛选复方金黄妇科泡腾片的处方并探究其制备工艺。方法:1)用LPS活化RAW264.7细胞进行造模,CCK-8法测定细胞活力,确定冰片和LPS的用药剂量。给药24 h后观察细胞一般形态;一步法测定NO含量;Western blotting法检测各组MAPK、Nrf2/HO-1和NF-κB通路相关蛋白的表达变化;DCFH-DA荧光探针法检测ROS
仿生机器鱼是进行水下观测、勘察的重要平台,相较于传统水下机器人具有推进效率高、机动性强、对环境影响小等特点,因此得到了学者广泛的研究。运动控制是机器鱼研究的基本问题之一,对于其完成任务的能力有着重要影响。本文以实验室两鳍仿鲹科机器鱼为对象,针对其3自由度胸鳍协同推进时机器鱼的运动控制方法展开研究,主要内容如下:(1)采用中枢模式发生器(Central Pattern Generator,CPG),