切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
会议论文
强化学习综述
强化学习综述
来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:zhongguoidc
【摘 要】
:
本文对当前强化学习的研究现状进行了综述。首先介绍强化学习的原理、结构以及主要算法;其次介绍目前强化学习中的不完全感知、多Agent强化学习及连续状态空间等几个研究热点
【作 者】
:
王冬黎
高阳
陈世福
【机 构】
:
南京大学 计算机软什新技术国家重点实验室 南京市 210093
【出 处】
:
中国人工智能学会第10届全国学术年会
【发表日期】
:
2003年期
【关键词】
:
强化学习
状态空间
研究现状
热点问题
Agent
算法
结构
感知
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对当前强化学习的研究现状进行了综述。首先介绍强化学习的原理、结构以及主要算法;其次介绍目前强化学习中的不完全感知、多Agent强化学习及连续状态空间等几个研究热点问题;最后给出强化学习的应用情况。
其他文献
进化算法在人工神经网络中的应用研究
本文综述了进化算法与人工神经络结合技术现状的研究,主要包括优化网络设计、输入数据预处理、网络集成等方面内容,并对研究过程中出现的主要问题及未来发展趋势进行了讨论。
会议
进化算法
人工神经网络
未来发展趋势
数据预处理
网络设计
网络集成
技术现状
优化
问题
讨论
输入
内容
经络
过程
高频序列挖掘模型用于异常检测的研究
本文应用序列挖掘方法对用户命令序列和特定行为序列进行分析,建立用户行为概貌和特定行为模型,并针对用户使用的高频命令序列,采用统计分析的方法对其进行独特性评价。实验结果
会议
高频
命令序列
挖掘模型
异常检测模型
分析的方法
用户行为
行为序列
行为模型
挖掘方法
特性评价
实验结果
稳定
统计
理想
概貌
粗糙集和神经网络结合技术的研究综述
本文对有关粗糙集与神经网络相结合的研究现状、关键技术和发展趋势进行综述,主要内容包括:①粗糙集用于数据预处理;②粗糙集用于神经元设计;③粗糙集用于神经网络结构设计。最后
会议
粗糙集
神经网络
网络结合
网络结构设计
数据预处理
主要内容
应用框架
研究现状
研究成果
关键技术
发展趋势
元设计
国内外
三维
基于支持向量机的财务失败预测
随着数据挖掘技术的发展,更多的统计学习和人工智能的方法备用在了信用风险度量当中。论文应用支持向量机(SVM)这种新的统计学习算法,对中国上市公刊的财务失败进行了预测。研
会议
支持向量机
统计学习算法
信用风险度量
数据挖掘技术
决策树方法
对数回归模型
预测精度
神经网络
人工智能
财务失败
SVM
中国
上市
论文
备用
基于知网的动名语义搭配研究
知网是一个大规模语义知识库。它的字典库和义原库蕴藏了丰富的语义信息。本文利用知网的三类语义关系:上下位关系、静与动的对应关系、动态相互感应关系,对最基本的动词名词之
会议
知网
动态相互感应关系
语义知识库
语义信息
语义理解
语义关系
语义搭配
对应关系
动宾搭配
字典库
上下位
主谓
义原
算法
名词
计算
动词
判断与识别的定性映射模型
将基准作为判断操作的必备条件(或参量),本文提出了最简判断和初等判断的定性映射(Qualitative Mapping,QM)τp(x,S)模型,并指出集合论中的特征函数、(简单)医疗诊断、数据库中
会议
统计模式识别
定性映射
特征向量法
医疗诊断
特征函数
区间矩阵
目标搜索
集合论
基准
初等判断
Mapping
数据库
条件
模型
操作
参量
并指
一种改进的C4.5学习算法:IC4.5
C4.5具有处理不完整数据、连续属性等能力。Quinlan通过试验对比了多种方法处理不完整数据的有效性,并把最有效的方法应用到C4.5中,使C4.5具有较好的处理不完整数据的能力。本
会议
改进
不完整数据
处理
学习算法
学习能力
方法
特定环境
试验对比
设计实现
连续属性
足球队
有效性
速度
分析
仿真
多变量决策树挖掘方法的研究
本文在总结了几种多变量决策树的挖掘方法后提出了一种挖掘多变量决策树的新方法。这种方法利用一些启发式信息将属性合组合起来,作为当前结点的分类属性,得到了与C4.5算法相比
会议
多变量决策树
挖掘方法
启发式信息
分类属性
分类效果
新方法
组合
总结
算法
结点
基于SOM的海量数据挖掘的研究
将SOM作为海量数据挖掘中的通用数据压缩算法,实现了对数据的有效压缩,使经典数据挖掘算法能够应用于海量数据挖掘领域。分析了这一方法的基本思想,介绍了处理过程,并与类似算法
会议
SOM
海量
数据挖掘算法
数据压缩算法
基本思想
处理过程
经典
分析
方法
Markov链模型在异常检测上的应用及参数对结果的影响
Markov链模型是一种较新的异常检测分析手段,本文使用了两种方法:单步Markov链计算序列支持度、多步Markov链方法,比较全面的研究了Markov链模型在异常检测上的应用。另外,本文通
会议
其他学术论文