并行强化学习算法及其应用研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：lxl_0598

【摘要】

：

强化学习是一种重要的机器学习方法，然而在实际应用中，收敛速度缓慢是其主要不足之一。为了提高强化学习的效率，提出了一种并行强化学习算法。多个同时学习，在各自学习一定周期后

【作者】

：

孟伟韩学东

【机构】

：

北京林业大学信息学院,中国航天科工集团706所

【出处】

：

计算机工程与应用

【发表日期】

：

2009年34期

【关键词】

：

并行算法强化学习 Q-学习 D-S证据理论路径规划

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化学习是一种重要的机器学习方法，然而在实际应用中，收敛速度缓慢是其主要不足之一。为了提高强化学习的效率，提出了一种并行强化学习算法。多个同时学习，在各自学习一定周期后，利用D—S证据利用对学习结果进行融合，然后在融合结果的基础上，各进行下一周期的学习，从而实现提高整个系统学习效率的目的。实验结果表明了该方法的可行性和有效性。

其他文献

无源时差定位系统的模糊无解问题

本文对平面三站无源时差定位系统的定位过程中可能出现的无解和模糊现象进行了探讨，找出了无解分布与布站以及观测噪声方差大小之间的规律，得出了模糊分布站之间关系，并提供了一

期刊

时差定位布站无源定位定位系统模糊处理passive TDOA locationambiguitynonsolutionthe placement

“卡夫丁峡谷”问题的当代性探析

"卡夫丁峡谷"问题是马克思在晚年分析俄国社会发展道路时提出的。"卡夫丁峡谷"问题的当代性在于它为我们提供了了解社会历史发展规律的视角,为落后国家实现社会跳跃式发展提

期刊

卡夫丁峡谷社会发展规律社会发展

稳定农业发展工业开发旅游业

文章针对西北地区信仰伊斯兰教的撒拉族、保安族、塔吉克族、乌孜别克族、塔塔尔族五个人口在10万人以下、社会经济发展水平比较滞后、农牧民人均纯收入比较低的少数民族实际

期刊

西北地区伊斯兰文化人口较少民族West coastal regions Muslim culture less populations nation

稳健加权总体最小二乘法

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

期刊

加权总体最小二乘选权迭代法稳健加权总体最小二乘Huber权函数IGG权函数

试析期货公司的合规监管

近年，期货监管部门以“放松管制，加强监管”为主导思路，以“两维护、一促进”为核心，围绕着简政放权，监管转型，鼓励创新，保护投资者权益，发挥市场功效，维护市场稳定等重点展开监管工作

期刊

期货公司监管转型管理

浅析4G基站在移动通信教学中的应用

期刊

4G移动通信教学eNodeB

上海市社区卫生服务中心国家基本药物制度实施效果的评价指标体系构建

目的：为构建合理的社区卫生服务中心国家基本药物制度实施效果的评价指标体系提供参考。方法：通过采用理论分析、文献研究和专家访谈等方法设计备选评价指标体系框架，进而运用德

期刊

上海市社区卫生服务中心国家基本药物制度实施效果评价指标体系德尔菲法层次分析法

多拍灰尘多提醒——镇海区落实党内询问和质询制度

会议室内没有主席台,桌子拼成矩阵,短边椅子上,一边坐着纪委领导,一边是政府职能部门“一把手”及分管领导,两侧是纪委委员和廉政监督员。这个布局特别的会议,是宁波市镇海区

期刊

纪委委员区纪委镇海区纪委全会

知识产权资产证券化立法模式选择——基于国外立法模式考察的思考

知识产权资产证券化作为重要的金融创新手段,需要充足完善的制度供给和规则体系来保障其发展,而立法模式的科学合理选择是实现法治化发展的基本前提。纵览国外,在资产证券化

期刊

知识产权资产证券化国外考察立法模式选择

西部高职教师信息化教学能力现状及提升策略

信息化教学能力是高职学院教师的教学基本能力之一,它直接影响着教师的教学质量和学生的学习质量。对此,我们借助教育部信息化教学指导委员会课题--"西部高职教师信息化教学

期刊

西部高职教师信息化能力调查提升策略

并行强化学习算法及其应用研究

其他学术论文