飞行器强化学习多模在轨控制

来源 :西安电子科技大学学报 | 被引量 : 0次 | 上传用户:lummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高飞行器控制系统长期在轨飞行的可靠性,提出了一种基于强化学习的多模式控制系统方案。该系统包括传感器模块、控制模块和执行模块。其中,传感器模块用于向控制模块实时输入飞行器敏感的飞行数据,该数据分为可供飞行器控制直接使用的具有历史相关性的多维结构化浮点数据以及某特定传感器独有的物理表征量;控制模块使用实时并行化决策机制,分为输入层、特征抽取层和全连接层;执行模块用于接收控制模块实时输出的驱动数据,包括用于决策的状态最优值和用于评价的动作输出值。系统根据用于决策的回报最优值决定使用哪些具体的执行模块,而某
其他文献
由于卫星影像的定位精度主要受卫星影像有理多项式参数的估计精度影响,而现有算法中通常采用像点补偿或利用地面控制点改正的方法,未考虑设计矩阵元素的误差特性,存在系统误差剔除不完全、参数估计精度不高等问题。考虑到模型系统误差的影响,提出了一种异方差估计方法。首先建立了设计矩阵元素的随机模型,对系统特性进行更精准的描述;然后将设计矩阵元素的系统偏差考虑在内,采用马氏距离构建最小二乘模型,并使用广义特征值方
聚焦于图书馆的新兴服务领域--知识产权信息服务,首先调研了国际、国内在本领域的研究动态与服务开展现状,并对科研机构图书馆的知识产权服务机制进行了系统研究,从面向科研
为解决传统监督学习方法在不均衡数据集异常检测上易出现过拟合的问题,提出一种非监督对抗学习方法用于硬盘故障预测。该方法使用长短期记忆神经网络和全连接层设计了一种可
近期有两个重要的电子竞技赛事对国内玩家来说比较瞩目。一个是在上海举办的韩国OSL2010第二赛季决赛,一个是在美国洛杉矶举办的WCG2010总决赛。两个比赛,分别对应的是联赛和
期刊
坏消息看起来不能再多了。大批赞助商的紧缩银根,随之而来是众多电子竞技俱乐部的解散或者裁员。多家经营电子竞技业务的公司已经或者濒临破产。产业链遭到了严重破坏。而当人们把“优存劣汰”作为慰藉的理由时,世界级品牌赛事ESWC母公司的破产消息彻底让所有人都清醒地认识到。电子竞技遭遇了从概念诞生以来的最大危机。  行业的发展有诸多变数,只言片语是说不清的。我只是在思考,如果把2004年定义为中国电子竞技的元
儿时手中拿着木棒或者玩具枪幻想着自己是个战士,几个人一群一伙分别扮成好人和坏人,嘴里发出枪声假装被对手击倒和击倒对手,大家永远都是快乐的。时光流转,当我们依靠科技力量依稀中重拾这一幕时,不管职业的还是非职业的都会在潜意识里追寻着这种最童真最原始的快乐。同时,还有另一种喜喜悲悲的荣誉油然而生。时过境迁,这种童真被数字化产业放大之后。又被赋予了新的意义。WCG在允许选手们高举国旗踏入赛场时,便承载了大
期刊
为了提高集成电路抗逆向工程的能力,通过对逻辑混淆技术的研究,提出了一种基于Reed-Muller伪装门的逻辑混淆设计方案。该方案首先在同一版图上采用不同虚拟孔配置实现基本单
目的了解流浪精神病患者的智力情况,为相关部门的救助与治疗提供科学依据。方法对符合美国精神病协会制定的《诊断与统计手册:精神障碍》(DSM-IV)诊断标准的371例流浪精神病患者