并行强化学习算法及其应用研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lxl_0598
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是一种重要的机器学习方法,然而在实际应用中,收敛速度缓慢是其主要不足之一。为了提高强化学习的效率,提出了一种并行强化学习算法。多个同时学习,在各自学习一定周期后,利用D—S证据利用对学习结果进行融合,然后在融合结果的基础上,各进行下一周期的学习,从而实现提高整个系统学习效率的目的。实验结果表明了该方法的可行性和有效性。
其他文献
本文对平面三站无源时差定位系统的定位过程中可能出现的无解和模糊现象进行了探讨,找出了无解分布与布站以及观测噪声方差大小之间的规律,得出了模糊分布站之间关系,并提供了一
"卡夫丁峡谷"问题是马克思在晚年分析俄国社会发展道路时提出的。"卡夫丁峡谷"问题的当代性在于它为我们提供了了解社会历史发展规律的视角,为落后国家实现社会跳跃式发展提
文章针对西北地区信仰伊斯兰教的撒拉族、保安族、塔吉克族、乌孜别克族、塔塔尔族五个人口在10万人以下、社会经济发展水平比较滞后、农牧民人均纯收入比较低的少数民族实际
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
近年,期货监管部门以“放松管制,加强监管”为主导思路,以“两维护、一促进”为核心,围绕着简政放权,监管转型,鼓励创新,保护投资者权益,发挥市场功效,维护市场稳定等重点展开监管工作
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的:为构建合理的社区卫生服务中心国家基本药物制度实施效果的评价指标体系提供参考。方法:通过采用理论分析、文献研究和专家访谈等方法设计备选评价指标体系框架,进而运用德
会议室内没有主席台,桌子拼成矩阵,短边椅子上,一边坐着纪委领导,一边是政府职能部门“一把手”及分管领导,两侧是纪委委员和廉政监督员。这个布局特别的会议,是宁波市镇海区
知识产权资产证券化作为重要的金融创新手段,需要充足完善的制度供给和规则体系来保障其发展,而立法模式的科学合理选择是实现法治化发展的基本前提。纵览国外,在资产证券化
信息化教学能力是高职学院教师的教学基本能力之一,它直接影响着教师的教学质量和学生的学习质量。对此,我们借助教育部信息化教学指导委员会课题--"西部高职教师信息化教学