论文部分内容阅读
根据参与决策的agent的行为,多agent决策通常可以分为两类:一类是所有agent之间都没有利益冲突的多agent集体决策;另一类是这些agent之间既有共同利益、又存在竞争关系的多agent多目标合作博弈。在多agent集体决策中,主要考虑如何最大程度的融合每个agent的不同意见、去除相互矛盾的信息,以做出最佳的决策;而多agent多目标合作博弈中,既要妥善解决不同agent之间合作与博弈的关系,还要同时满足决策的多个目标。对于这两个问题的研究是有现实意义的,本文的主要工作就是围绕这两方面展开的。
首先,在多agent集体决策中,可以用影响图来表示agent对于决策环境的认识;为了使决策结果更为准确,需要将不同agent构造的影响图合并起来。由于影响图与贝叶斯网在结构上具有很多相似之处,本文首先在贝叶斯网结构合并的基础上,给出了影响图的结构合并的方法,然后借助于D-S证据理论等方法实现了概率表和效用表的融合,使得决策模型得以优化。
其次,本文讨论了多agent多步博弈问题的特点,说明了其解空间的规模过大且求解困难。利用遗传算法在解决大规模问题中所具有的优秀的全局搜索性能,提出了基于遗传算法求解多agent多步博弈的方法。
再次,本文分析了多agent多目标合作博弈除了具有解空间规模巨大的特点以外,还要处理多agent之间的合作与竞争,且需要同时满足多个目标,提出了一种将遗传算法与适合具体问题的其他算法相结合求解多agent多目标合作博弈的方法思想。
由于笔者水平有限,本文一定存在很多不足的地方;为了弥补这些不足,文章在最后给出了部分未来研究方向。