非即时回报的合作型多agent学习模型

来源 :电脑知识与技术(学术交流) | 被引量 : 0次 | 上传用户:painangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于DFL[1]的agent学习已经受到了不少研究者的关注。文献[2]给出了一种即时回报的DF环境下的多agent学习模型,文献[3]给出DF环境下的单agent学习算法,文献[4]介绍了DF环境中agent的心智模型。本文主要是在这些文献的基础上,具体构建了一个基于DFL的非即时回报的合作型多agent学习模型。主要内容包括该模型的结构、主要数据结构,以及相应的算法,最后还给出了一个验证实例。 In recent years, agent learning based on DFL [1] has attracted the attention of many researchers. Literature [2] gives a real-time reward multi-agent learning model in DF environment. Literature [3] gives single-agent learning algorithm in DF environment. Literature [4] introduces the mental model of agent in DF environment. Based on these documents, this dissertation constructs a cooperative multi-agent learning model based on DFL, which is based on non-immediate feedback. The main contents include the structure of the model, the main data structure, and the corresponding algorithm, and finally gives a verification example.
其他文献
提出了以visual C++为开发工具,基于OpenGL技术,开发军用物资装载仿真系统的具体方案.采用数值仿真与可视化技术相结合的方法,建立了军用物资装载模型,对物资装载量与装载方
商业银行作为一个高风险行业,面临着各种各样的风险,操作风险就是其中不容忽视的一类。2010年7月随着中国农业银行的上市,我国大型商业银行已全部完成股份制改造。这意味着中
首批严格意义上的证券投资基金自1998年诞生以来,基金业已经经历了十多个年头。在这蓬勃发展的期间,基金品种不断创新,数量也不断增加。特别是这几年,随着物价持续上涨CPI的
作为我国主要的票据品种——商业汇票,它既具有支付结算,也具有短期融资功能,对满足企业的结算支付、扩展融资渠道、减少财务费用,提高商业银行的服务水平、加强资产管理和负
随着互联网技术的发展,家庭网络已经慢慢进入实际应用当中,本文对智能家庭网络的业务类型、实现的关键技术进行了阐述,并提出了实际解决方案。 With the development of Int
中国的崛起带动了媒体国际传播能力的日渐强大。作为国际传播的主力军,电视机构应当思考如何充分发掘第一媒体的优势,在理念、技术和内容上锐意创新,在提升我国国际影响力和
简单回顾了RBAC模型的概念以及属性证书的定义,从理论上探讨了如何应用X509v4标准的属性证书来实现基于角色的权限管理。在访问控制基本框架的和属性权威概念的基础上提出一
期刊
本文主要是研究我国开放式基金投资者的申购、赎回行为。开放式基金是一种利益共享、风险共担的集合理财方式,从2001年我国第一只开放式基金发行至今经历了近十年的时间。开