高性能处理器中运算单元的研究与设计

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lanqie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运算单元是高性能处理器芯片中的关键部件,在视频图像处理、无线通信、超算等领域,由于数据量并行性高,对数据运算的精度和实时性要求高,而且这些数据的处理中有大部分的加法操作和乘法操作,对运算部件的运算性能提出了很高的要求,这是评价DSP性能的一个重要方面。  本文依托中国科学院自动化研究所国家专用集成电路设计工程技术研究中心自主研制的高性能代数处理器“MaPU”的第二代处理器UCP,旨在研究和设计其中的运算部件,满足处理器对SIMD乘法运算和浮点运算处理能力的要求。  本文设计的SIMD定点乘法器支持的数据粒度有word、short、byte类型,即乘法单元内部支持1个32×32-bit,2个16×16-bit或者4个8×8-bit的有符号/无符号乘法操作,1个16×16-bit或者2个8×8-bit的复数乘法操作。本文对加法器结构、乘法器算法和结构以及浮点运算单元做了深入的研究。乘法器实现的关键在于乘法运算中部分积的产生和部分积的累加电路的复杂度。本文采用改进的并行可复用多粒度的Booth编码算法来减少部分积的数目,采用3-2压缩器和4-2压缩器混合Wallace树型结构来加快压缩过程,并提出一种全新的硬件自动优化推导的方法。  浮点运算能力是考察处理器性能的另一重要指标。本文设计的浮点乘法器支持单精度浮点和双精度浮点乘法,在具体设计中,进行符号位的处理,指数相加运算和尾数相乘运算,并对尾数进行规格化处理和舍入处理。  在设计完成后进行经过功能验证,确保了验证的充分性和设计的正确性。利用Design Complier工具对设计进行逻辑综合,使得运算部件在28nmCMOS工艺下工作频率达到1.2GHz,达到所要求的的性能指标。
其他文献
一体化网络测井处理解释软件平台[1]是一套支持网络的并完全采用面向对象思想设计的大型测井综合应用软件系统。平台的设计原则兼顾开放性、先进性和平台无关性,采用开放的Jav
在过去的几十年里,磁盘一直是最常用的存储介质。然而,随着电子技术的快速发展,嵌入式系统、航空航天等应用领域对数据存储提出了远远超出磁盘存储能力的需求。在这种背景下,闪存
WIA-PA规范是由中国技术人员自主研发的工业无线标准,于2008年10月成为国际通用标准,该规范同Wireless HART,ISA100.11a一起成为当今国际上工业无线方面的应用规范。众所周知,无
计算机技术和网络的快速发展,在家庭应用方面引起了重大的变革。数字家庭的重要特征和目标是将家庭中各类消费电子产品、移动设备和个人电脑等设备通过网络连接起来,实现网络的
随着智能终端尤其是智能手机的迅速普及和移动互联网的蓬勃发展,各种移动应用纷纷涌现。这些应用大都内嵌了各种各样的LBS服务(Location Based Service,基于位置的服务),这无
随着计算机和视频通信技术的发展,自由视点方法已成为了一个新的研究热点,广泛应用于教育领域、场景展示、商业领域等。与传统的展示方法相比自由视点方法具有如下优点:建模容
中医学作为有中国特色的传统医学具有重要的社会价值。中医医案是中医临床思维活动和辨证论治过程的记录,是中医理法方药综合应用的具体反映形式,尤其是经过多年临床实践、具有
学位
Ad Hoc网络是一种不依赖于固定基础设施的、自组织的无线网络。网络中所有节点的地位平等,具有无中心、多跳路由、拓扑结构动态变化等特点。在军事、灾难救助、移动办公等领域
道路交通拥堵及其伴生的环境污染和安全问题已引起世界各国的广泛关注,成为影响经济和社会和谐发展的全球性问题。道路交通是一个由人、车、路和环境等诸多要素组成的系统,各种
学位