面向5G的通用通信处理器关键技术研究与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lxfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
5G移动通信系统是面向2020年移动通信需求提出的新一代移动通信系统。与现有的移动通信系统相比,5G移动通信系统在无线覆盖能力、传输时延、系统安全和用户体验方面将得到显著提高。同时,5G移动通信系统将与其他移动通信技术密切结合,构成新一代无所不在的移动信息网络,满足未来10年移动互联网流量增加100倍的发展需求。根据IMT2020白皮书的规定,5G系统下行峰值吞吐率达到10Gbps,上行峰值吞吐率达则达到2Gbps。如何对海量数据进行快速高效地处理,成为未来5G移动通信系统所面临的首要问题。  由于通信领域算法具有经典性强、数据量大、复杂度高、并行度高、实时性强的五个特点,面向移动通信领域的处理器不断朝着并行加速的方向发展。考虑到功耗与成本等因素,目前商用的通信处理器多采用DSP与协处理器结合的架构。其中,协处理器由多个ASIC组合而成。DSP完成一般的信号处理,并调度不同功能的ASIC完成算法固定以及数据相关性较强等无法用传统DSP高效实现的运算。由于协处理器是定制化的硬件电路,其灵活性较差,无法同时满足多种协议要求。此外,目前5G标准尚未冻结,相关算法研究尚未成熟,难以设计面向5G的高性能协处理器。  MaPU1.0处理器是中国科学院自动化研究所国家专用集成电路设计工程技术研究中心自主研发的一款通用数字信号处理器。MaPU1.0具有自主知识产权的AppAISArcTM指令集体系结构,在存储上创新性的提出了“同心圆”架构,并具有灵活的多粒度并行存储结构。上述特点使得MaPU1.0在处理FFT、FIR等高密集型算子时具有领先的性能功耗比。然而,MaPU1.0作为一款面向超算、通信、多媒体等多个领域的通用验证性处理器,在通信领域应用时可进一步深度优化,在发挥上述特点及优势的同时更加适应通信领域信号处理。  面对5G系统的海量运算需求,本课题突破ASIC实现时的诸多限制,汲取MaPU1.0处理器的特点及优势,设计一款面向5G的通用通信处理器UCP,通过全软件编程的形式实现整个基带链路数据处理。本论文对UCP设计和应用的几个关键技术进行研究。论文的主要工作和创新点归纳如下:  1.针对5G基带链路实现瓶颈进行研究和探索,结合硬件并行实现提出高效低复杂度的算法,降低5G基带链路实现难度。  (1)提出了灵活可并行的低复杂度Massive MIMO检测方法  针对传统Massive MIMO检测算法复杂度高、并行度低的问题,本文提出了一类灵活可并行的低复杂度Massive MIMO检测算法。该算法对Massive MIMO检测时复杂的矩阵运算进行简化,根据硬件结构灵活构造具有不同并行度的算子,从而调动全部硬件资源实现Massive MIMO检测过程。该算法将检测复杂度由传统方法的O(K3)降低至O(K2)。相较于其它简化算法,本文所构造的算法达到近似性能时,可减少1/2的除法运算和部分乘法运算,并且并行度提升一倍。相较于传统方法,等价乘法次数可降低2/3甚至更多。  (2)提出了低复杂度的LDPC译码方法  针对传统LDPC译码算法中乘法、比较次数过多的问题,本文提出了一种低复杂度的LDPC译码算法。该算法对译码时的横向更新过程进行简化,利用传统算法中的缩放因子和迭代次数构造调整因子,将次小值计算中的乘法、比较操作转换为移位操作。该算法将传统译码算法中的乘法、比较操作降低一半,仅增加了与比较等量的移位操作。相较于其它简化算法,本文所构造的算法将乘法操作降低一半,并将等量加法操作转化为更易于硬件实现的移位操作。性能上较传统方法损失0.1dB,较其它简化算法稳定性更强。  (3)提出了低时延的Polar译码方法  针对传统Polar译码算法中排序过程时延过大的问题,本文提出了三种基于Pairwise排序的路径筛选算法。全排序算法FS-PMS充分利用路径度量间的关系对不必要的比较过程进行删减,相较于现有用于Polar译码的排序算法,具有更少的比较次数,在硬件并行度低于每级比较次数时可得到更短的时延。半排序算法HS-PMS则在此基础上,对最后合并过程进行简化,相较于现有用于Polar译码的排序算法,具有更少的比较级数,在硬件并行度不低于每级比较次数时可得到更短的时延。多比特算法M-PMS则适用于多比特并行译码的排序过程,具有更少的比较级数,在多比特并行译码时可得到更短的时延。  2.提出了基于AppAISArcTM指令集体系结构的UCP微操作指令集  针对MaPU1.0指令集未对通信领域专门优化,商用通信处理器过多依赖协处理器进行硬件加速的问题,本文提出了一套基于AppAI SArcTM指令集体系结构的面向5G通信微操作指令集。该指令集专门针对通信领域深度优化,不仅包含常见的基本数据处理指令,更针对通信领域的高密集型算子和不易于DSP实现的比特级/软比特级算子定制了相应指令,并在不同部件中复用了部分常见指令。该微操作指令集能够有效的支持高密集型算子的并行加速,创新性的通过软件编程形式完成商用通信处理器中协处理器的硬件加速处理,极大的提高了实现时的灵活性。  3.提出了适用于通信算法零时间重构的UCP微体系结构  针对MaPU1.0微体系结构未对通信领域专门优化,商用处理器支持灵活实现的算子类型较少的问题,本文提出了一种适用于通信算法零时间重构的UCP微体系结构。该结构中的运算部件能够与不同通信算法高度适配,部件间的互联结构既具有较强的灵活性,又能够满足各类运算需求,存储结构遵照“同心圆”思想,各个层次的存储空间能够有效地适配不同指令与算法。该微体系结构能在与通信算法紧密集合的同时,进一步发挥MaPU系列处理器性能功耗比的优势。  4.提出了高效的UCP代数指令开发方法  针对具有高并行度、强实时性特征的通信领域算法在实现时需充分发挥硬件性能的问题,本文提出了一套高效的UCP代数指令开发方法。该方法能够指导程序员充分挖掘UCP的处理能力,高效完成从通信算法到代数指令的开发过程。该方法通过最优性能分析获取算法实现的最优性能以及最优条件,从最优条件出发构建算法并行实现时的DAG图,利用关键路径优先法编写微码流水线,再根据整体数据特征进行流水线优化。该方法可指导程序员提取达到或接近理论最优性能的代数指令。  5.构建了基于UCP的5G算法代数指令库  本文利用所提的代数指令开发方法,在所设计的UCP上构建了5G算法代数指令库,以代数指令的形式实现了符号级与比特级运算中的绝大多数核心算法。其中,符号级代数指令包括FFT、复数FIR滤波、实数FIR滤波、矩阵乘法、IDFT,比特级代数指令包括64QAM调制、CRC校验、LDPC编码、LDPC译码。上述代数指令的平均微操作指令覆盖率和指令槽利用率均接近80%,充分说明了所设计微操作指令集与微体系结构的高效性。在处理性能上,符号级性能较MaPU1.0提升近4倍,比特级性能均达到Gbps,可满足5G移动通信系统的吞吐率需求。
其他文献
随着生产力的提高,经济社会的进步,车辆已经成为日益普及的交通工具。随之而来的问题就是,交通拥堵现象明显,交通事故频生。如何合理有效地提高道路的利用效率,从而缓解交通
实时系统时间分析的主要工作之一就是计算任务或系统的最坏情况执行时间(WCET)。由于目前大多数的实时嵌入式系统都采用了实时操作系统(RTOS)来管理和调度任务,因此系统的时间
传统的确定数据流管理系统及技术在近几年中得到了长足的发展并形成了成熟的研究领域。然而,随着信息产业各领域的不断发展和近似测量数据的硬件被大量应用,使得对不确定数据
军队公积金是军队后勤管理中的一个重要组成部分。中国人民解放军的军官、文职干部、军士长、专业军士、正式职工及军队供养的离退休人员住房建设、维修、管理的专项资金,由
随着计算机科学和通信技术的迅猛发展,传统的计算机辅助医疗技术已经渐渐不能满足广大医务工作者和研究人员的使用需求,他们迫切的需要不受地域限制,通过计算机网络进行辅助
随着IT全球化的快速发展和信息技术的日新月异,RFID和物联网技术已逐渐深入我们生活的方方面面,相关技术及标准的研究和制定也正在进行之中。本文对现有的RFID技术和应用进行
无线传感器网络是一种集成了传感器、嵌入式计算、分布式信息处理和无线通信等技术的新型网络,它在军事领域和民用领域有着巨大的科研价值和应用潜力。在无线传感器网络中因
复杂攻击由一系列有逻辑关系的攻击行为构成,隐蔽性强、破坏性大、威胁范围广,已经成为网络攻击的主要形式之一。如何发现复杂攻击的内在联系,识别其攻击意图和预测下一步攻击行
随着无线网络通信技术和定位技术的发展,移动对象已被广泛地应用到许多领域,例如交通监控、位置信息服务等等。作为数据挖掘领域当中的重要技术,异常点检测技术可以发现数据集当
随着Internet技术的发展,XML作为信息表示和数据交换的标准受到越来越多的关注,如何有效地存储和查询XML数据已经成为当前研究的热点。Twig模式查询是XML查询处理的核心操作,