Energy Efficient Transmission in Underlay CR-NOMA Networks Enabled by Reinforcement Learning

来源 :中国通信(英文版) | 被引量 : 0次 | 上传用户:monorrch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In order to improve the energy ef-ficiency (EE) in the underlay cognitive radio(CR)networks, a power allocation strategy based on an actor-critic reinforcement learning is proposed, where a cluster of cognitive users(CUs) can simultaneously access to the same primary spectrum band under the interference constraints of the primary user (PU), by em-ploying the non-orthogonal multiple access(NOMA) technique. In the proposed scheme,the optimization of the power allocation is formulated as a non-convex optimization problem. Additionally, the power allocation for different CUs is based on the actor-critic reinforcement learning model, in which the weighted data rate is set as the reward func-tion,and the generated action strategy (i.e. the power allocation) is iteratively criticized and updated. Both the CU's spectral efficiency and the PU's interference constrains are considered in the training of the actor-critic reinforcement learning. Furthermore, the first order Taylor approximation as well as other manipulations are adopted to solve the power allocation op-timization problem for the sake of considering the conventional channel conditions. Accord-ing to the simulation results, we find that our scheme could achieve a higher spectral effi-ciency for the CUs compared to a benchmark scheme without learning process as well as the existing Q-leaming based method, while the resultant interference affecting the PU trans-mission can be maintained at a given tolerated limit.
其他文献
目的姿态变化和遮挡导致行人表现出明显差异,给行人再识别带来了巨大挑战。针对以上问题,本文提出一种融合形变与遮挡机制的行人再识别算法。方法为了模拟行人姿态的变化,在基础网络输出的特征图上采用卷积的形式为特征图的每个位置学习两个偏移量,偏移量包括水平和垂直两个方向,后续的卷积操作通过考虑每个位置的偏移量提取形变的特征,从而提高网络应对行人姿态改变时的能力;为了解决遮挡问题,本文通过擦除空间注意力高响应
  对2008年1月 11 日—2月1日,达州市出现了持续低温雨雪天气过程进行了分析。结果表明,这次持续低温雨雪天气是欧亚大气环流的多次调整发展和极涡振荡引起的东亚大槽的建立
2018年11月,《国家组织药品集中采购试点方案》在11个城市进行试点.而后,我国进行了三批国家药品集中采购,分别为:第一批2019年9月30日,完成25个中选药品,平均降幅达到59%;第
期刊
由于家庭宽带用户发展迅猛,同时随着用户上网行为改变及内容源的丰富导致近几年网络流量年增速保持在100%以上,传统IDC作为内容源的重要组成部分,对于保障网络质量、用户的发
  使用2006年7月至2007年6月沪宁高速公路沿线梅村和仙人山站附近的逐分钟路面温度、气温、湿度、风向、风速、降水等气象资料,分析了梅村和仙人山路面温度日变化特征。结果
  本文以经验台风公式和QSCAT/NCEP混合风场资料为基础,通过一个权重系数构造西北太平洋海域台风风场,并以此作为一个第三代海浪模式WAVEWATCH Ⅲ的输入风场,模拟了2005年的麦
目的视频行为识别和理解是智能监控、人机交互和虚拟现实等诸多应用中的一项基础技术,由于视频时空结构的复杂性,以及视频内容的多样性,当前行为识别仍面临如何高效提取视频的时域表示、如何高效提取视频特征并在时间轴上建模的难点问题。针对这些难点,提出了一种多特征融合的行为识别模型。方法首先,提取视频中高频信息和低频信息,采用本文提出的两帧融合算法和三帧融合算法压缩原始数据,保留原始视频绝大多数信息,增强原始
随着5G技术的进一步发展,其涉及的行业越来越普遍,并且在许多行业的发展中都取得了显著成果.根据对5G移动通信发展趋势的预测和分析,以及对其中关键技术的分析,可以更加有力
用风云2号红外云图和红外黑体温度(TBB)、地而加密自动站雨量和风的观测、NECP(1)(°)×1(°)再分析资料,对造成河北中部区域性暴雨的一次中尺度对流复合体(MCC)进行了分析.
  2007年3月4日天津地区遭遇了暴风雪的袭击,4日凌晨,途经天津的10条高速公路全部封闭。渤海湾遇到了自1969年以来最强的风暴潮,天津港停运。此次暴风雪天气对陆、海、空的