基于蚁群算法的多Agent系统强化学习研究与应用

来源 :东北电力大学 | 被引量 : 0次 | 上传用户:wyn44298
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Agent、多Agent系统理论以及与其相关的强化学习等理论受到越来越多研究人员的重视。随着单Agent学习方法的研究成功,人们也将注意力投向了更为复杂的多Agent系统。在很多实际应用中,单个Agent可能存在无法完成任务,或完成任务的效率很低的问题,因此对多Agent系统的研究势在必行。但多Agent系统的内部组织结构远比单Agent复杂,且外部的任务环境更加动态化,所以对该领域的研究极具挑战性。 蚁群算法是一种崭新的求解组合优化问题的方法,它通过模拟蚂蚁的觅食行为以达到求解比较困难的组合优化问题的目的,是目前仿生学算法中比较成功的例子。它以其全局优化、正反馈、分布式计算、智能搜索、易与其他算法相结合等特点而越来越受到人们的关注。 本文所要解决的问题是如何使Agent自主掌握与其他Agent交互的技巧,并同时兼顾自身利益和整体利益等问题。在研究多Agent系统强化学习算法的基础上,把蚁群算法与之结合起来,提出了一种新的算法——基于蚁群算法的多Agent系统强化学习算法,使多个Agent之间更好的合作,加快学习效率。并通过实验证明了该算法的有效性。 本文最后利用提出的新算法求解一类NP问题以进一步验证该算法的有效性。通过对TSP(Traveling Salesmen Problem)这个经典的NP问题进行求解,总结出利用新算法求解一类NP问题的通用方法,实验结果显示新算法求解这类问题是可行的。
其他文献
基于WEB的饮水安全信息管理系统(WSIS)受陕西省水利厅委托开发,用于全省饮水安全项目信息的采集、管理与决策支持,对于提高群众饮水安全的监督管理水平具有非常重要的实际意
随着社会经济的不断发展,洪水灾害所造成的经济损失和社会影响与日俱增,因此,防汛减灾是世界各国普遍关注的问题。防汛决策支持系统是防汛减灾指挥系统的核心,它在信息、通信和计
命名图(Named Graphs)可以作为语义网中信任问题的解决方法之一。采用命名图的形式发布本体,同时在用户使用时加入相应的信任策略选取信任本体,可以在一定程度上保证信息来源
自计算机网络诞生以来,安全就一直是一个非常关键的问题。由于P2P(Peer-to-Peer)网络包含了许多不同于传统的客户端/服务器模式的新的安全问题,因此P2P网络的安全已成为一个研
随着信息技术的飞速发展,计算机软件在社会各个领域的普及程度越来越高,同时社会对计算机软件也提出更高的要求,软件的规模和复杂度越来越高,面向网络的分布式软件系统是软件发展
在许多公司内部,存在着使用多年、积累了丰富的数据,从过去到当前一直发挥着重要作用的遗留系统。由于需求改变、平台升级以及新技术出现使得我们不得不对一些过去证明是成功的
随着军用航空技术的迅猛发展,飞行员感受和所需管理的各种信息爆炸性增加,以CCD作为传感器的各种地基、空基摄像系统的应用也越来越广泛。由于空间目标往往是淹没在复杂的环境
近年来,互联网中的VoIP业务得到广泛应用,通话模式已由PCTOPC的方式逐渐发展为PCTOPHONE或者PHONETOPHONE,给电信运营企业的传统电信话音业务带来了新的市场的同时,也带来了巨大
随着Internet发展进程的加快,网络信息资源在数量上呈爆炸式增长。现有的搜索引擎大多是基于文本和关键字的通用检索,存在查询方式单一、查准率低、用户满意度差等诸多问题。为
随着无线通信技术及移动定位技术的高速发展,基于位置的服务(locationbased services)获得了广泛的推广及应用。通过基于位置的服务,人们可以随时随地获得需要的信息。然而,