【摘 要】
:
在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态表示、奖赏设计、策略搜索、终身学习以及在
【机 构】
:
南京大学计算机科学与技术系,南京CCF人工智能与模式识别专业委员会
【出 处】
:
CCF2015-2016中国计算机科学技术发展报告会
论文部分内容阅读
在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态表示、奖赏设计、策略搜索、终身学习以及在电脑围棋上的应用,并展望未来的发展趋势.
其他文献
应用全二维气相色谱/飞行时间质谱(GC×GC/TOFMS)定性分析了芝麻香酒中含硫化合物,并对三个单位的芝麻香成品酒中含硫化合物进行了比较.在相同条件下,1#芝麻香酒检测到16种含
旋挖钻机是目前岩土钻掘工程中应用最多的钻机类型之一.由于中国不同地域的地质条件和环境条件差异较大,在旋挖钻头和工艺参数优选方面仍需进一步深入研究.因此根据地层岩土
本文主要介绍了低收缩混凝土原材料的选择和配合比确定的制备过程,探讨了聚羧酸系高效减水剂的减水机理,同时对上海光源现场施工的低收缩混凝土的具体各项试验数据进行分析,
为增加米烧酒的香气,本研究开发了富含己酸乙酯的米烧酒生产工艺.小规模实验表明,在发酵过程中添加己酸菌,可获得含己酸乙酯的米烧酒.己酸菌的最佳添加时间是二次发酵的第一
本文介绍了以风味导向技术为学术思想指导下进行的中国白酒风味特征解析及代谢调控的最新进展情况,包括对中国白酒风味化合物的鉴定、特征风味化合物的判定;白酒中重要香气物
数据中心是信息社会的重要基础.尽管大数据时代才刚刚开始,如今许多数据中心的性能已经严重受功耗和碳排放的制约和影响.在最近几年中,一些新型绿色高效能数据中心设计逐渐涌
很多复杂的数据管理和分析任务难以通过自动处理方式完成,而利用人类的认知能力可以帮助解决这些"机器难"任务,例如,实体解析、情感分析和图像识别.众包数据管理就是借助互联
随着计算技术的迅猛发展、科学理论模型日渐成熟,分布式并行计算与软件在科学、工程、经济与社会等领域都有了广泛应用,用分布式并行计算来模拟或(部分)代替实验已成为可能.
软件分析是软件生命周期中许多活动(分析、设计、实现、测试、维护等)的基础,也是软件领域长期稳定的研究内容.本文首先对软件分析进行概述,然后结合近5~10年来发表的学术文章
网络空间安全事关经济发展、社会稳定和国家安全,目前已得到了世界各国的高度重视,并纷纷将其提升为国家战略.为加强我国网络空间安全研究和人才培养,教育部批准设立了网络空