基于演化算法的连通子图挖掘方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wll201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘研究的深入,越来越多的问题呈现在我们面前,也提出了更高的要求。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理论研究,并试图利用结构化数据挖掘方面的经验和方法论来帮助解决新问题。而连通子图挖掘问题就是本文所致力研究的问题。 本文主要研究了N连通子图挖掘问题和多信息连通子图挖掘问题。N连通子图发现问题是在一个很大的图中寻找一个较小的子图来表现几个给定节点在图中的关系的问题。多信息连通子图挖掘问题是在一个边有多种类型的图中寻找连通几个特定结点的,能够满足问题约束的连通子图的问题。本文的主要工作和特色如下: 1.本文提出了一个新的解决N-连通子图挖掘问题的方法。首先分析了问题并定义了一个评价函数来评价一个子图表现N个给定节点之间关系的好坏。同时设计了一个特殊的UTM编码来表示一个确定结点数的图的拓扑结构。使用UTM编码能够避免在进化过程中多余的编码步骤,能够减小算法的时间和空间消耗。在UTM编码和评价函数的基础上,设计了一个演化算法来对图的拓扑结构进行优化。实验结果显示该算法能够有效地在不同类型的网络上发现连通子图。 2.在N连通子图挖掘问题之后,本文针对多信息连通子图发现问题的特点,提出了一个通用的进化算法。设计了一种表示多信息子图拓扑结构的特殊编码——多信息子图编码MSC。使用MSC编码能够很好的表示多信息连通子图,这个编码能够在进化过程中能够减少时间和空间的消耗。同时在真实数据上的实验结果显示该算法是有效的。 3.在前面两个算法的基础上,将连通子图挖掘问题与对象层次的搜索问题相结合,能够解决对象层次的查询项扩展问题。对于算法的两个部分使用了不同的快速优化策略。对于候选子图算法,计算量最大的部分可以提前预处理并且存储下来,在算法的过程中只需要执行简单的计算,无须多次遍历原始图。对于进化算法,使用不同的算子和参数设置能够使算法收敛更快,也能更好的避免算法陷入局部最优解。
其他文献
网络入侵检测在信息安全中占据着重要的地位,而深度包检测(DPI, DeepPacket Inspection)是基于规则匹配的网络入侵检测系统实现的重要方法。目前正则表达式被广泛用于描述DPI
移动Ad Hoc网络(MANET,Mobile Ad Hoe Network)是由一组带有无线收发装置的移动节点组成的无固定基础设施支持的临时性通信网络。近年来,由于移动Ad Hoe网络的灵活性与实用性,在
汽车业供应链是由客户、生产企业与零部件供应商组成的一个庞大网络,一个完成的供应链管理系统可以改进企业间的协作机制和供求关系,为企业提供直接的市场信息和广阔的销售渠道
网格被誉为继Internet和Web之后的第三次信息技术浪潮,借鉴了现有的电力网的思想,它试图实现互联网上所有资源的连通,即把整个互联网整合成一台巨大的超级计算机,包括计算资源、
全光传输网络以其稳定性好和传输容量大等优点,正迅速成为带宽需求较大的下一代通信网络主要发展方向之一。基于波分复用(Wavelength DivisionMultiplexing-WDM)技术,可以在一
生产调度是冷轧板材生产的枢纽,调度的合理性、准确性、及时性都直接影响了整个生产组织有序性、连续性、产能高低、产品质量好坏,以及企业应对市场变化的能力高低。在信息技
近年来,随着计算机的普及和Intemet的飞速发展,地理信息系统在房地产管理、汽车GPS自动导航、三维虚拟现实仿真等领域得到广泛应用,并具有越来越大的市场。这些应用都需要空间数
随着各种覆盖网系统规模和数量的剧增,它们独立探测底层网络性能对网络资源造成的浪费,以及独自选路导致的路由抖动和不公平性等问题日渐受到人们的重视。承载网(Underlay)是为
随着计算机网络和通信技术的飞速发展,网络环境已经从早期相对静态的、面向特定组织和用户群体的封闭网络,转变为可公共访问的、面向大量动态用户的开放网络,其主要应用领域包括
流数据查询是流数据处理中一个非常重要的研究领域,由于流数据到来的快速性和大量性等特点,必须及时地对流数据进行处理,流数据的输入速率突然剧增会使查询系统发生过载,将严重影