机器增强学习在围棋死活题上下文模式上的运用

来源 :2007年中国机器博弈学术研讨会 | 被引量 : 0次 | 上传用户:xiaoshumin82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的人工智能中的搜索方法让计算机国际象棋的博弈水平超过了人类,然而围棋广大的搜索空间一直是人工智能领域一个未能攻克的难题。通过对围棋知识的学习来指引搜索过程成为近年来计算机围棋领域的一个新兴课题。机器增强学习在许多领域有着广泛的应用。将机器增强学习的方法应用到对死活问题的学习上。学习过程中的状态用搜索过程中收集到的模式进行表示,并通过增强学习中TD(λ)的方法对这些模式所代表的状态进行赋值。实验结果表明本文所采用的模式组的状态表示方法还不够理想。与此同时对造成此结果的主要原因进行了分析并提供了可能的改进方法。
其他文献
水力旋流器在颗粒分级脱泥、料浆浓缩等工艺中,依靠旋转流中不同直径或比重的颗粒所受到离心力大小不同,从而完成颗粒的快速分级与分离,通过旋流器分级可以得到粒度组成不同
石膏是一种重要的工业原料,在建筑制品和水泥工业中有着广泛的用途,本文从如下几个方面进行了探讨: 一.工业副产品石膏的成分和形态 二.工业副产品石膏的综合利用
本文从如下几个方面进行了探讨:1.磷资源的不可再生性及战略地位;2.国外磷矿资源开发现状及发展趋势分析;3.国内磷矿资源的开发现状分析;4.我国磷矿资源开发利用存在的主要问题;5.
本文从三个方面对水泥预分解窑消纳工业废弃物进行了论述:一.水泥预分解窑的工艺流程;二.水泥预分解窑消纳废弃物的可行性判据;三.处理途径及相应的前提条件。
本文研究了TD(λ)-时序差分学习技术在非完备信息机器博弈中的应用,将时序差分学习技术和蒙特卡罗抽样技术相结合,实现了一个自学习的非完备信息博弈系统。传统的静态线形估值
由于围棋博弈复杂度,围棋博弈中的模式是提高计算机围棋博弈水平的关键之一。本文结合专业围棋选手的经验,讨论了计算机围棋博弈中模式表示的基本要素,描述了一种基于XML的系统
中国象棋的机器博弈已经发展得很快,尤其是棋天大圣软件的开发成功更有着重要的转折意义。众所周知,韩国象棋源于三国,继承于中国象棋。中国象棋和韩国象棋存在很多共同点,也存在
计算机博弈有着近50年的发展历史,其中国际象棋的博弈研究已经取得了巨大的成功。 中国象棋的博弈研究起步较晚,特别是硬件博弈系统。本文给出了一种采用并行处理的博弈专
四国军棋是人机对弈的一个新兴领域,它为不确定信息下的人工智能研究提供了一块新的平台。而评价函数是任何人机博弈程序的重要组成部分,它是决定人机博弈程序棋力的重要因素。
首先完成了棋手棋力判定的基本方法,并给出了相应的算法。接下来讨论了搭建以及在线棋力测试平台的实现和模块组装,最后对研究结论进行了下一步的展望。