基于多智能体Q学习的车载通信MAC层信道接入技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:qqliveqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车载自组织网络(VANET,Vehicular ad-hoc network)作为支持ITS(Intelligent Transportation Systems,智能交通系统)应用的重要技术,解决安全相关问题时通常依赖于安全消息的实时可靠传输。VANET因其网络拓扑结构变化快、节点高速移动的特点在车辆密度较高的网络场景中使用传统的IEEE 802.11p协议发送消息很容易发生碰撞,难以保证安全消息低时延和高接收率的传输,且对不同网络负载场景不具可扩展性。因此,本文针对信道接入方法的可扩展性和公平性的问题对传统的接入方法进行改进,通过建立新模型为VANET设计高效的MAC协议,主要工作如下:首先,在车载通信车辆接入无线信道发送数据过程中引入Q学习,为车辆节点建立智能体Q学习模型,提出了基于Q学习的动态调整竞争窗口算法(QL-CWmin),推导了车辆节点在网络环境中进行Q学习的状态——动作映射关系和车辆节点更新累计奖赏值的迭代公式,这样车辆节点每次需要接入无线信道发送数据时,就总选择能使累计奖赏值最大的CW值接入无线信道,在理论分析的基础上通过仿真验证了所提出的算法对提高车辆节点接入无线信道的公平性和对不同网络负载场景的可扩展性。其次,针对单个车辆节点在网络环境中进行Q学习存在仅感知部分网络环境、学习搜索空间大效率低、与其他车辆节点无交互学习的问题,为VANET建立多智能体Q学习系统模型,提出了基于多智能体Q学习的动态调整竞争窗口算法(QL-CWMulti-agent),对多个车辆节点Q学习的联合状态——动作对映射关系和车辆节点根据联合策略更新Q值函数的迭代表达式进行了推导,在前一研究点的基础上提高车辆节点接入无线信道的公平性及算法对不同网络负载的可扩展性。最后,将多智能体学习的最终结果收敛到相关均衡,根据eCEQ(Correlated Equilibrium Q,相关均衡Q学习)算法(即最大化所有智能体奖励的最小值)使车载自组织网络中每个车辆节点接入无线信道成功发送数据的次数最大化,通过仿真验证了算法收敛结果的正确性。
其他文献
"产业结构转型升级"在经济学中对应于产业经济学产业结构理论提出的产业结构的高度化和合理化过程。本文在经济系统模型中,运用产业经济学的相关理论,讨论文化产业发展与当前
为了准确地模拟混凝土材料的力学性能,从有效应力的角度出发,基于连续损伤力学基本原理,根据混凝土的应力-应变关系曲线(以改进的Saenz曲线为例),推导出混凝土受压损伤演化方
带钢的卷取温度控制精度直接影响其组织性能和力学性能,是保证板带质量和板形良好的关键因素。因此,对带钢层流冷却系统的分析和研究具有深远的现实意义。本文以国内某热轧厂的
企业年金是组成社会养老保险体系的三大支柱之一。发展企业年金制度对于完善养老保险体系、应对人口老龄化挑战、发展市场经济具有重要意义。在一些发达的工业化国家,企业年金
不确定非线性系统的反馈控制是控制理论中的热点研究问题,可用于航空航天、电力、石油化工、机器人等领域。一方面,区别于线性系统,非线性系统会呈现本质非线性现象,如有限时
正定广惠寺华塔第三层塔心室内供奉有两尊唐代石佛造像,且均刻有铭文。本文通过对铭文的分析认为,两尊佛像应系唐代为国忌行香而造。有明确纪年的此类佛像存世者甚少,这两尊
2012年"五一"前夕,《丝路撷英——旅顺博物馆藏丝绸之路文物展》开展,该展览是在原《新疆历史文物专题陈列》基础上进行的改陈,将馆藏的新疆文物及古代印度石雕佛像等藏品资
随着企业国内竞争国际化,国际竞争国内化。企业的全球化势头愈演越烈,市场瞬息万变,产品的生命周期不断缩短,要在这种竞争激烈的市场环境中立于不败之地,企业必须加强内部管
为增强Android多媒体系统的功能,在Android智能手机上添加WMA音频播放功能,使Android平台支持WMA格式,播放WMA格式文件。基于Android多媒体系统的Stagefright框架,通过创建WM
基于成藏体系理论对传统区带油气资源评价技术进行了系统归纳与新方法的补充,深入阐述了成藏体系油气资源评价的内涵。其中,在深层次剖析上述制约因素的形成机制以及相关统计数