非即时回报的合作型多agent学习模型

来源 :电脑知识与技术(学术交流) | 被引量 : 0次 | 上传用户：painangel

【摘要】

：

近年来,基于DFL[1]的agent学习已经受到了不少研究者的关注。文献[2]给出了一种即时回报的DF环境下的多agent学习模型,文献[3]给出DF环境下的单agent学习算法,文献[4]介绍了D

【作者】

：

谢丽萍彭波

【机构】

：

苏州经贸职业技术学院信息系,苏州经贸职业技术学院信息系江苏苏州215009,江苏苏州215009

【出处】

：

电脑知识与技术(学术交流)

【发表日期】

：

2007年03期

【关键词】

：

DFL agent学习 Q-learning

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,基于DFL[1]的agent学习已经受到了不少研究者的关注。文献[2]给出了一种即时回报的DF环境下的多agent学习模型,文献[3]给出DF环境下的单agent学习算法,文献[4]介绍了DF环境中agent的心智模型。本文主要是在这些文献的基础上,具体构建了一个基于DFL的非即时回报的合作型多agent学习模型。主要内容包括该模型的结构、主要数据结构,以及相应的算法,最后还给出了一个验证实例。 In recent years, agent learning based on DFL [1] has attracted the attention of many researchers. Literature [2] gives a real-time reward multi-agent learning model in DF environment. Literature [3] gives single-agent learning algorithm in DF environment. Literature [4] introduces the mental model of agent in DF environment. Based on these documents, this dissertation constructs a cooperative multi-agent learning model based on DFL, which is based on non-immediate feedback. The main contents include the structure of the model, the main data structure, and the corresponding algorithm, and finally gives a verification example.

其他文献

基于OpenGL的军用物资装载仿真系统研究

提出了以visual C++为开发工具,基于OpenGL技术,开发军用物资装载仿真系统的具体方案.采用数值仿真与可视化技术相结合的方法,建立了军用物资装载模型,对物资装载量与装载方

期刊

OpenGL三维模型虚拟装载

我国商业银行操作风险管理对策研究

商业银行作为一个高风险行业,面临着各种各样的风险,操作风险就是其中不容忽视的一类。2010年7月随着中国农业银行的上市,我国大型商业银行已全部完成股份制改造。这意味着中

学位

商业银行操作风险风险管理客户满意度

商业银行基金托管风险管理研究

首批严格意义上的证券投资基金自1998年诞生以来,基金业已经经历了十多个年头。在这蓬勃发展的期间,基金品种不断创新,数量也不断增加。特别是这几年,随着物价持续上涨CPI的

学位

商业银行基金托管风险管理理财方式

我国银行电子商业汇票业务发展的问题与对策研究

作为我国主要的票据品种——商业汇票,它既具有支付结算,也具有短期融资功能,对满足企业的结算支付、扩展融资渠道、减少财务费用,提高商业银行的服务水平、加强资产管理和负

学位

电子商业汇票融资功能金融行业资产管理

智能家庭网络发展和应用研究

随着互联网技术的发展,家庭网络已经慢慢进入实际应用当中,本文对智能家庭网络的业务类型、实现的关键技术进行了阐述,并提出了实际解决方案。 With the development of Int

期刊

智能家庭网络发展应用研究

融媒时代电视机构国际传播的创新路径

中国的崛起带动了媒体国际传播能力的日渐强大。作为国际传播的主力军,电视机构应当思考如何充分发掘第一媒体的优势,在理念、技术和内容上锐意创新,在提升我国国际影响力和

期刊

国际传播电视机构创新路径融媒时代渠道拓展传播实践经验得失传播路径传播能力英语频道

基于属性证书和策略的RBAC应用研究

简单回顾了RBAC模型的概念以及属性证书的定义,从理论上探讨了如何应用X509v4标准的属性证书来实现基于角色的权限管理。在访问控制基本框架的和属性权威概念的基础上提出一

期刊

属性证书RBACX509v4策略访问控制PMI

商务部要求企业以变求强应对出口退税新政策美方取消对我三类纺织品进口实行许可证管理的规定我国免检产品评选不搞终身制今年我国纺织品出口面临更多贸易保护主义障碍

期刊

商务部企业出口退税新政策纺织品出口进口许可证管理免检产品评选终身制贸易保护主义

三十而立新气象百年基业铸辉煌

期刊

中国开放式基金投资者申购、赎回行为分析

本文主要是研究我国开放式基金投资者的申购、赎回行为。开放式基金是一种利益共享、风险共担的集合理财方式,从2001年我国第一只开放式基金发行至今经历了近十年的时间。开

学位

开放式基金申购行为赎回行为

非即时回报的合作型多agent学习模型

其他学术论文