强化学习综述

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:zhongguoidc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对当前强化学习的研究现状进行了综述。首先介绍强化学习的原理、结构以及主要算法;其次介绍目前强化学习中的不完全感知、多Agent强化学习及连续状态空间等几个研究热点问题;最后给出强化学习的应用情况。
其他文献
本文综述了进化算法与人工神经络结合技术现状的研究,主要包括优化网络设计、输入数据预处理、网络集成等方面内容,并对研究过程中出现的主要问题及未来发展趋势进行了讨论。
本文应用序列挖掘方法对用户命令序列和特定行为序列进行分析,建立用户行为概貌和特定行为模型,并针对用户使用的高频命令序列,采用统计分析的方法对其进行独特性评价。实验结果
本文对有关粗糙集与神经网络相结合的研究现状、关键技术和发展趋势进行综述,主要内容包括:①粗糙集用于数据预处理;②粗糙集用于神经元设计;③粗糙集用于神经网络结构设计。最后
随着数据挖掘技术的发展,更多的统计学习和人工智能的方法备用在了信用风险度量当中。论文应用支持向量机(SVM)这种新的统计学习算法,对中国上市公刊的财务失败进行了预测。研
知网是一个大规模语义知识库。它的字典库和义原库蕴藏了丰富的语义信息。本文利用知网的三类语义关系:上下位关系、静与动的对应关系、动态相互感应关系,对最基本的动词名词之
将基准作为判断操作的必备条件(或参量),本文提出了最简判断和初等判断的定性映射(Qualitative Mapping,QM)τp(x,S)模型,并指出集合论中的特征函数、(简单)医疗诊断、数据库中
C4.5具有处理不完整数据、连续属性等能力。Quinlan通过试验对比了多种方法处理不完整数据的有效性,并把最有效的方法应用到C4.5中,使C4.5具有较好的处理不完整数据的能力。本
本文在总结了几种多变量决策树的挖掘方法后提出了一种挖掘多变量决策树的新方法。这种方法利用一些启发式信息将属性合组合起来,作为当前结点的分类属性,得到了与C4.5算法相比
将SOM作为海量数据挖掘中的通用数据压缩算法,实现了对数据的有效压缩,使经典数据挖掘算法能够应用于海量数据挖掘领域。分析了这一方法的基本思想,介绍了处理过程,并与类似算法
Markov链模型是一种较新的异常检测分析手段,本文使用了两种方法:单步Markov链计算序列支持度、多步Markov链方法,比较全面的研究了Markov链模型在异常检测上的应用。另外,本文通
会议