双人零和博弈问题中策略搜索算法的研究

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:szcbg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双人零和博弈问题是机器博弈研究的一个重要方向,其研究内容涉及知识表示、博弈树搜索算法、局面状态评估函数等。其中,如何制定高效准确的博弈树搜索算法是提高智能体在零和博弈问题中决策质量的关键技术。极大极小算法作为最常用的博弈树搜索算法,从理论上讲,当计算能力达到可以搜索整棵博弈树时,该算法能够搜索得到完备信息零和博弈的最优解。由于计算能力有限,实际应用中通常使用带有启发式评估函数的极大极小算法。启发式评估函数的存在不可避免的会产生评估误差,有学者们对于带有启发式评估误差的极大极小算法的搜索质量提出了质疑。人们研究发现对于某些类别的博弈树,更深层次的极大极小搜索反而会降低决策质量。他们将这种现象称为“博弈树病理现象”。由于大多数真实的博弈问题整体上表现为非病理性,使得对于极大极小算法研究仍集中于通过提高搜索效率来提升搜索深度的方向。但是,病态节点被认为存在于所有的博弈树中,不可避免的影响着启发式极大极小算法的搜索质量。本文通过分析博弈树病理现象以及极大极小算法产生搜索偏差的原因,提出了优化经典极大极小算法备份规则后的搜索算法,并将其命名为迭代最优极大极小(IOM)算法。通过在人为构建的模拟博弈树以及真实博弈问题中的实验,表明迭代最优极大极小算法在浅层的搜索中相较极大极小算法表现出了明显的优势。当搜索深度较高时,这两种算法的搜索结果趋于相似。该搜索算法表现出更好的健壮性,为极大极小算法在浅层搜索中搜索结果偏差较大的问题提供了解决思路。同时,本文还将迭代最优极大极小算法同误差最小化极大极小(EMM)算法进行了对比。误差最小化极大极小算法是为了降低病态节点对搜索质量的影响而提出的基于预先区分节点类型思想的搜索算法。但误差最小化极大极小算法存在启发式函数误差水平难以准确设定,算法复杂度无法降低等问题。为体现迭代最优极大极小算法在复杂度方面的优势,本文还提出了迭代最优极大极小算法的alpha-beta剪枝策略。最后,通过在真实博弈环境中的对比实验表明迭代最优极大极小算法同样具有更高的决策质量。
其他文献
基于Lawless建立的跨国企业与生产成本均衡模型,分析技术性贸易壁垒(TBT)对异质性企业出口行为的影响,并运用双重差分法进行实证检验后发现:TBT会迫使低生产率企业出口产品退
条码技术是利用光电扫描阅读设备识读条码信息并将其输入计算机的技术。条码具有传输速度快、差错率低等优点,通过条码技术对标准化项目档案进行监管,改变档案的采集方式,提
2009年10月份以来,全球油脂油料市场在消化了美国大豆产量创纪录的利空数据后,受全球通胀预期升温以及美元大幅下滑带动,走出了触底反弹的行情。由于新季油籽上市之前,中央政府适
英语读写课程采用大班的教学模式,具有种种弊病,严重影响了教学效果,导致学生英语读写译水平不但没有提高,甚至有的学生反而下降。解决读写大班困难的方法是分级教学。当分级教学
目的通过对哈密、和田两地暗娼人群性病相关知识和患病率的调查分析,评价卫九项目在此人群中的于预效果,为今后暗娼干预提供科学依据。方法性病相关知识、安全套使用、正确就医
应用0.5um CMOS工艺,在5V电压下设计了一个放大倍数为81.29d B的二级运算放大器,采用了密勒补偿的方法对电路进行补偿,相位裕度达到64度。偏置电路中采用cascode连接结构确保
目的 :探讨阻塞性肺气肿的病因与发病机制,常见的护理诊断和护理措施。方法 :查阅相关医院的临床资料,对慢性阻塞性肺疾病病人采取的一系列护理措施,观察治疗效果总结护理经
<正>一、设计思路本节课是将纸牌魔术和数学常规教学相结合的创新课程,纸牌魔术贯穿课堂的始终,具有挑战性与神秘性,提高了学生的兴趣与参与度,大大激发了学生学习数学的欲望
结核病是艾滋病(AIDS)最常见的机会性感染之一,两者相互影响,互为因果。随着艾滋病病毒(HIV)感染者/AIDS病人的不断增加,HIV合并结核菌双重感染的发生率也不断上升。现将重庆市传染病
道德智慧的获取从实践中未,更应该回到实践中去。相对于其他体验活动,学生在调查实践活动中面对的不是生活的“复制品”,而是确实的“真品”,只有全身心“参与”到生活中去调查,才