基于深度强化学习的视频游戏模拟算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户：bbboy

【摘要】

：

【作者】

：

许江涛

【出处】

：

哈尔滨理工大学

【发表日期】

：

2019年08期

【关键词】

：

强化学习深度学习视频游戏 Gabor滤波器激活函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机图形技术、网络技术和人机交互技术的发展,视频游戏的研究也进入到了一个全新的阶段。早期视频游戏的输入画面粗糙,游戏难度单一,不能给予游戏玩家较好的游戏体验。为了创造更加真实的游戏虚拟环境,增加游戏的可玩性和挑战性,实现玩家与游戏智能体之间更加真实的交互,视频游戏模拟的研究变得至关重要。一直以来,强化学习由于无法直接处理来自环境的原始感官数据,因而应用范围非常有限。近年来深度学习发展迅速,通过深度神经网络能够自动提取出高维图像中的特征,因此越来越多的学者开始研究深度学习和强化学习的结合,即深度强化学习。深度强化学习在视频游戏模拟中存在着游戏得分低的问题,为了解决这些问题,提出一种基于改进深度Q网络(DQN)的视频游戏模拟算法。该算法首先对卷积神经网络(CNN)的激活函数进行改进,结合ReLU和Softplus两种激活函数的优点,设计并构造一种分段激活函数,用改进的激活函数作为CNN全连接层的激活函数。其次设计改进的Gabor滤波器,用其代替CNN中原有的可训练的滤波器。最后将视频游戏的每帧图像和改进后的Gabor滤波器卷积得到多个不同方向的特征,然后将其进行特征融合。使用核主成分分析(KPCA)对融合后的特征进行降维,以此替代原始视频游戏图像作为CNN的输入,利用强化学习的Q-Learning算法训练更新网络权重,得到训练模型,实现视频游戏的模拟。实验表明,结合深度神经网络的强化学习模型,通过使用改进后的激活函数和改进后的Gabor滤波器进行训练,能够成功学习到控制策略。与传统的强化学习模型相比,改进后的模型在视频游戏上的表现效果更好。

其他文献

城市环境提升中植物彩化的作用——以南昌九龙湖新区世界VR大会环境提升项目为例

2018年10月19日,世界VR产业大会在南昌市举行。借此契机,南昌市着力推动城市建设,提升城市环境品质,进行了绿化公共空间彩化提升,尤其是在新优植物运用方面有所提高,这也与世

期刊

世界VR大会植物彩化环境提升

谢庄《月赋》与欧阳詹《秋月赋》形制之比较

前此学者研究六朝赋与唐赋之关系,多从思想情感与题材变迁等方面着眼,本文则试图另辟蹊径,采用个案分析的方法,从六朝谢庄《月赋》和唐代欧阳詹《秋月赋》两首赋之形制来比较

期刊

六朝唐朝谢庄欧阳詹月赋

杉木2.5代种子园开花物候遗传变异分析

在小坑林场2009年营建的杉木2．5代种子园中选择20个建园无性系，于2012年2月和3月开展开花物候观测。数据分析结果表明：各无性系间的始花期、盛花期和末花期存在极显著差异；同一无

期刊

杉木种子园开花物候

实践/操劳与理论

《存在与时间》中的“操劳”（Besorgen）这个概念深受亚里士多德“实践”（praxis）概念的影响,突出的一点为,海德格尔认为“操劳有它自己的认识”,这可以视作实践有其特属的知,即ph

期刊

实践聪慧(实践智慧)理论

论《湖光山色》——“茅盾文学奖”获奖作品丛论之二

《湖光山色》是周大新长篇小说的代表作,获第7届＂茅盾文学奖＂。小说描写了丹湖西岸楚王庄的旷开田和楚暖暖这对年轻夫妇及时抓住楚长城遗址的发现和南水北调工程等所带来的经济

期刊

《湖光山色》长篇小说旷开田结构“乡土”气息

心灵的攀登:境界论思维对大学文化素质教育的启迪——基于东南大学教育实践的探索与思考

境界论思维是具有中国特色的一种思维方式,实现心灵境界的提升是境界论思维的价值取向。东南大学在文化素质教育实践中汲取境界论思维,融合高峰体验理论,开展经典教育和创新

期刊

境界论思维文化素质教育

油松种子园开花结实规律研究进展

对油松种子园开花生物学特性、球花分布规律、花粉密度与飞散规律、种实产量预测、种实品质差异成因等方面的研究状况作了较为系统的综述。 In this paper, we systematical

期刊

油松种子园开花规律结实规律

林木种子园的生态学意义及提高增益的关键技术

林木种子园为现代林业生产提供大量优质种源。是规模化造林成败与否的关键因子之一。本文在综述现代林木种子园分类和建园技术路线的基础上，分析了种子园的生态学意义和对进化

期刊

种子园遗传多样性遗传增益

浅谈网络对体育舞蹈报道现状新思考——以中华舞蹈网为例

通过对体育舞蹈报道的现状分析,探讨出我国体育舞蹈现行报道中存在的障碍及原因,由于网络报道的形式主要以网站的形式,大多数的具有国际影响力的体育舞蹈赛事也很少有网络直

期刊

网络中华舞蹈网体育舞蹈对策

言意新辨

本文从“我们用语言思考吗”这个问题开始追问，围绕“语言决定论”和“思想语假说”这两种针锋相对的主张提出质疑。本文指出，“用什么思考”的意思不是“思考时心里浮现了什么

期刊

语言决定论思想语表达思考语言心象内部语言翻译言不尽意

基于深度强化学习的视频游戏模拟算法研究

其他学术论文