Energy Efficient Transmission in Underlay CR-NOMA Networks Enabled by Reinforcement Learning

来源 :中国通信（英文版） | 被引量 : 0次 | 上传用户：monorrch

【摘要】

：

In order to improve the energy ef-ficiency (EE) in the underlay cognitive radio(CR)networks, a power allocation strategy based on an actor-critic reinforcement

【作者】

：

Wei Liang Soon Xin Ng Jia Shi Lixin Li Dawei Wang

【机构】

：

School of Information and Electronic, Northwestern Polytechnical University, No.127, Youyixi Road, X

【出处】

：

中国通信（英文版）

【发表日期】

：

2020年12期

【关键词】

：

cognitive radio network non-or-thogonal multiple access scheme power allo-cation

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

In order to improve the energy ef-ficiency (EE) in the underlay cognitive radio(CR)networks, a power allocation strategy based on an actor-critic reinforcement learning is proposed, where a cluster of cognitive users(CUs) can simultaneously access to the same primary spectrum band under the interference constraints of the primary user (PU), by em-ploying the non-orthogonal multiple access(NOMA) technique. In the proposed scheme,the optimization of the power allocation is formulated as a non-convex optimization problem. Additionally, the power allocation for different CUs is based on the actor-critic reinforcement learning model, in which the weighted data rate is set as the reward func-tion,and the generated action strategy (i.e. the power allocation) is iteratively criticized and updated. Both the CU's spectral efficiency and the PU's interference constrains are considered in the training of the actor-critic reinforcement learning. Furthermore, the first order Taylor approximation as well as other manipulations are adopted to solve the power allocation op-timization problem for the sake of considering the conventional channel conditions. Accord-ing to the simulation results, we find that our scheme could achieve a higher spectral effi-ciency for the CUs compared to a benchmark scheme without learning process as well as the existing Q-leaming based method, while the resultant interference affecting the PU trans-mission can be maintained at a given tolerated limit.

其他文献

针对形变与遮挡问题的行人再识别

目的姿态变化和遮挡导致行人表现出明显差异,给行人再识别带来了巨大挑战。针对以上问题,本文提出一种融合形变与遮挡机制的行人再识别算法。方法为了模拟行人姿态的变化,在基础网络输出的特征图上采用卷积的形式为特征图的每个位置学习两个偏移量,偏移量包括水平和垂直两个方向,后续的卷积操作通过考虑每个位置的偏移量提取形变的特征,从而提高网络应对行人姿态改变时的能力;为了解决遮挡问题,本文通过擦除空间注意力高响应

期刊

行人再识别形变遮挡空间注意力机制鲁棒性

2008年1月中下旬达州低温雨雪天气过程总结

　　对2008年1月 11 日—2月1日，达州市出现了持续低温雨雪天气过程进行了分析。结果表明，这次持续低温雨雪天气是欧亚大气环流的多次调整发展和极涡振荡引起的东亚大槽的建立

会议

达州市持续低温天气过程预报经验纬向环流天气系统环流形势东亚大槽

国家集中招采影响医保药品格局

2018年11月,《国家组织药品集中采购试点方案》在11个城市进行试点.而后,我国进行了三批国家药品集中采购,分别为:第一批2019年9月30日,完成25个中选药品,平均降幅达到59％;第

期刊

省内IDC接入CMNet网络优化探讨

由于家庭宽带用户发展迅猛,同时随着用户上网行为改变及内容源的丰富导致近几年网络流量年增速保持在100％以上,传统IDC作为内容源的重要组成部分,对于保障网络质量、用户的发

期刊

IDC省网城域网接入优化

沪宁高速公路路面温度变化特征以及预报方法研究

　　使用2006年7月至2007年6月沪宁高速公路沿线梅村和仙人山站附近的逐分钟路面温度、气温、湿度、风向、风速、降水等气象资料，分析了梅村和仙人山路面温度日变化特征。结果

会议

沪宁高速公路路面温度变化特征路面温度温度预报模型实际应用日变化特征气温

中国近海海域台风浪模拟实验

　　本文以经验台风公式和QSCAT/NCEP混合风场资料为基础，通过一个权重系数构造西北太平洋海域台风风场，并以此作为一个第三代海浪模式WAVEWATCH Ⅲ的输入风场，模拟了2005年的麦

会议

中国近海海域台风浪台风风场海浪模式西北太平洋海域有效途径权重系数

多特征融合的行为识别模型

目的视频行为识别和理解是智能监控、人机交互和虚拟现实等诸多应用中的一项基础技术,由于视频时空结构的复杂性,以及视频内容的多样性,当前行为识别仍面临如何高效提取视频的时域表示、如何高效提取视频特征并在时间轴上建模的难点问题。针对这些难点,提出了一种多特征融合的行为识别模型。方法首先,提取视频中高频信息和低频信息,采用本文提出的两帧融合算法和三帧融合算法压缩原始数据,保留原始视频绝大多数信息,增强原始

期刊

行为识别双路特征提取网络3维卷积神经网络双向卷积长短期记忆网络加权融合高频特征低频特征

5G移动通信技术发展与应用趋势

随着5G技术的进一步发展,其涉及的行业越来越普遍,并且在许多行业的发展中都取得了显著成果.根据对5G移动通信发展趋势的预测和分析,以及对其中关键技术的分析,可以更加有力

期刊

5G通信发展应用关键特点技术发展

一次MCC的云图特征及成因分析

用风云2号红外云图和红外黑体温度(TBB)、地而加密自动站雨量和风的观测、NECP(1)(°)×1(°)再分析资料,对造成河北中部区域性暴雨的一次中尺度对流复合体(MCC)进行了分析.

会议

MCC云图特征中尺度对流复合体再分析资料天气尺度红外云图自动站湿位涡

2007年3月4日天津暴雪天气分析

　　2007年3月4日天津地区遭遇了暴风雪的袭击,4日凌晨,途经天津的10条高速公路全部封闭。渤海湾遇到了自1969年以来最强的风暴潮,天津港停运。此次暴风雪天气对陆、海、空的

会议

天津港暴雪天气常规探测资料暴风雪多普勒雷达诊断分析高速公路服务提供

Energy Efficient Transmission in Underlay CR-NOMA Networks Enabled by Reinforcement Learning

其他学术论文