【摘 要】
:
针对移动机器人在未知环境中避障和路径规划自适应能力差的问题,受心理学方面内在动机启发,以加入引力势场的Q学习理论为基础,提出一种基于内在动机机制的引力场Q( IM GPF Q)
【基金项目】
:
国家自然科学基金(61203343);河北省自然科学基金(F2018209289);河北省高等学校科学技术研究青年基金项目(QN2016102,QN2016105)~~
论文部分内容阅读
针对移动机器人在未知环境中避障和路径规划自适应能力差的问题,受心理学方面内在动机启发,以加入引力势场的Q学习理论为基础,提出一种基于内在动机机制的引力场Q( IM GPF Q)学习算法。该算法以Q学习为理论框架,加入引力势场为算法提供先验知识,以内在动机作为内部奖励,与外部信号一起生成取向评价值,指引机器人学会自主选择最优路径。通过模拟客厅环境和两种具有陷阱的环境中进行的仿真实验,结果表明该算法能使机器人通过与外界未知环境进行交互获得认知,最终完成路径规划任务,与传统强化学习方法相比具有更快的收敛速度以及
其他文献
目的 研究黏着斑激酶(FAK)在大鼠移植静脉再狭窄过程中的作用,并研究奥美沙坦的干预效应。方法 建立大鼠颈外静脉移植模型,将40只雄性大鼠随机分成:1)假手术组;2)模型组;3)奥美沙坦组;4)
目的分析民航广州地区空勤人员尿液毒品筛查出现假阳性的影响原因,为提高检测结果的准确性提供建议。方法采用“吗啡/甲基安非他命/氯胺酮联合试剂盒”对2015年6月-2017年6月
新时代,新思路,新方法。教师要改变以往的课堂教学方法,树立课堂就是生活、生活也是课堂的新观念。本文从闲暇教育是课堂教学最基本、最有效的补充方式;教师引导学生在闲暇的
目的通过检测垂体腺瘤中六氧-甲基鸟嘌呤-DNA-甲基转移酶(MGMT)的表达,了解MGMT在不同类型垂体腺瘤中的表达水平及其与垂体腺瘤侵袭性的关系。方法收集2011年10月至2012年8月
针对各类系统资源如何高效协同运作以适应战场变化问题,建立了系统资源主体模型,提出了一种基于工作流和自主协商相结合的系统资源主体动态协同机制,并建立了4种系统资源主体
目的采用动态血压监测(ABPM)观察比索洛尔/氢氯噻嗪复方片对轻、中度原发性高血压患者服药后18~24h血压和血压晨峰(MBPS)程度的影响。方法选择90例轻、中度高血压患者[收缩压(SBP)〈1
针对长沙地铁2号线车辆蓄电池鼓包的问题,根据故障时的环境数据,从浮充电压、充电电流、极板群拆解进行调查分析,并制定有效避免此故障的改进措施.
丁帆的学术随笔散文集《人间风景》以风景为抒写主题。一方面,在对自然风景的叙述中,其散文展示出鲜明的智性风格,包括洞悉文化悖论的哲学内涵、寻求精神解放的人性内涵和回
<正>要保持纸币的声誉,防伪的重要性自然不言而喻。但是防伪的一个重要支撑点是要有不易仿造的技术。这在古代中国是比较困难的。因为总体来说,古代中国处在一个手工业时代,