【摘 要】
:
针对完全信息博弈中搜索时间受限的算法设计问题,在考虑博弈模型不同特点及对结局影响程度的基础上,提出了分阶段的算法模型,给出了三阶段博弈算法设计方法。通过改造影响搜
【机 构】
:
北京信息科技大学计算机学院,北京信息科技大学感知与计算智能联合实验室
【基金项目】
:
北京信息科技大学2020年促进高校内涵发展——大学生科研训练项目(5102010805);科技计划一般项目(KM201911232002)资助
论文部分内容阅读
针对完全信息博弈中搜索时间受限的算法设计问题,在考虑博弈模型不同特点及对结局影响程度的基础上,提出了分阶段的算法模型,给出了三阶段博弈算法设计方法。通过改造影响搜索策略的目标函数,使得在时间受限的前提下,能够方便控制每一阶段均更有效地搜索出较好策略,并给出相应的算法实现与分析。以点格棋为对象,给出了通过改造UCT算法中UCB公式的实现思路,设计了方向引导控制策略、多种算法混合、二进制压缩和并行化处理等技巧,有效提升了算法的效率和稳定性,并通过试验验证了所给出方法的有效性和效率。
其他文献
德日进(1881-1955)是一位法国耶稣会的神父;又是一位著名的科学家。具体地讲,他是一位地质学家,古生物学家,还是一位哲学家,思想家。1950年德日进被选为法国科学院的院士。因为德日
大量数据研究表明,运动员通过平衡饮食,摄取膳食营养是保证运动员日常训练和比赛顺利完成的重要条件,为了研究现阶段我国跆拳道运动员膳食状况,以湖南省跆拳道队运动员为调查
目的:探讨64排螺旋CT对不同程度冠状动脉狭窄的诊断价值。方法:选取在我院就诊的51例疑似冠状动脉狭窄患者进行研究,患者均分别行常规冠脉造影及64排螺旋CT诊断,分别作为对照
采用溶剂热法合成了三种M(HBTC)(4,4’-bipy)·3DMF(M=Ni,Co,Zn,HBTC=1,3,5-均苯三甲酸,4,4’-bipy=4,4′-联吡啶)结构的支柱层金属有机骨架材料(MOFs).首次采用溶剂热和微波法合
2008年,中国稻谷连续第五年增产,大米市场供略大于求。从运行特征看,2008年国内稻谷价格震荡走高.国内大米价格冲高回落,国际大米价格暴涨暴跌。2009年,预计国内大米市场疲弱依旧,国
随着社会发展,不可再生的石化能源在毫无节制消耗的过程中产生大量的二氧化碳,由此引发的碳排放问题已日益严重。目前,氢能源因其清洁且能量密度高等优点而备受各个国家的关注,但是氢气的储存和运输过程中所面临的安全和低效的问题一直是制约氢气大规模发展的重要因素。传统的储氢方式主要为物理储氢,存在储氢率低、成本高、运输难和储放氢条件苛刻等问题。关于氢气的新型储存方式已有大量的研究,然而目前的报道仍无法同时满足
1999年12月18日,第一辆奇瑞“风云”下线,奇瑞的造车历史从这一刻开启;2020年12月18日,第900万辆奇瑞“艾瑞泽5 PLUS”上市,第一个900万辆在此刻定格。奇瑞第一个900万辆用了
在庆祝中华人民共和国成立60周年诞辰的国庆日前夕,新中国古生物界的一批科研成果,东渡日本到千叶县的幕张驿,从2009年7月18日——9月27日,圆满地完成了题为《恐龙2009沙漠的奇观
醇类化合物选择性氧化是有机合成中一个非常重要的反应,在精细化工领域具有重要应用.而以水为绿色溶剂,分子氧为绿色氧化剂实现醇类化合物选择性氧化是绿色化学领域的一大挑