快速浮点加法器的优化设计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：zhangbingkai

【摘要】

：

随着时代的发展，在多媒体领域和科学计算领域，当代处理器的一个重要特征就是，在中央处理器(CPU)中将把浮点运算的部件作为核心运算部件直接集成于其中。在信号处理以及图像处理

【作者】

：

冯为

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2009年期

【关键词】

：

浮点加法器优化设计中央处理器浮点运算浮点指令

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着时代的发展，在多媒体领域和科学计算领域，当代处理器的一个重要特征就是，在中央处理器(CPU)中将把浮点运算的部件作为核心运算部件直接集成于其中。在信号处理以及图像处理以及语音识别等一些应用中，人们对高性能浮点处理单元(Floating Point Unit，简称FPU)的需要就更加迫切了，总之就是在越来越多的领域中，尤其是一些对于数字处理有着高速实时要求的领域，浮点数的运算发挥出越来越重要的作用，因而浮点运算单元成为中央处理器设计中的决定性能的关键部件之一。根据Oberman的统计，浮点指令中使用最频繁的是浮点加法指令，浮点加法运算占用了浮点运算的55％以上。浮点加法、减法、转换和传送都最终都可以转换成为浮点加法运算完成，由于浮点加法的使用频率最高同时设计难度最大，所以浮点加法器又成为浮点运算单元(FPU)中最为关键的部件，它的性能好坏将直接影响FPU的性能进而影响决定了CPU的浮点运算能力。因此，设计高速的浮点加法器更是重中之重。本文的主要目的就是关于浮点加法器的优化设计，首先介绍了国内外FPU发展历史和现状研究，并对浮点数处理器的应用进行了讨论，接着对于浮点数系统以及IEEE-754标准，以及IEEE-754所定义的特殊值，异常和它的舍入模式做了相应的介绍。从第三章开始，采用自顶向下的设计方法，从传统的5周期浮点加法算法入手，对于其步骤分析进行改进，引入了Two-Path算法。这样就构建了浮点算法中的基本思路以及各个基本组件构成，第四章则分别对于浮点加法器中的各个组件设计进行详细的分析以及优化，比如前导零的电路，错位并行电路设计思想的引入，复合加法器的优化设计，以及桶形移位器的采用和舍入合并技术的引进。经过上述的优化设计后，浮点加法器的加法运算从传统的5周期变成了目前所需要的3周期，这极大地提高了加法器的速度。设计完成后，对于其进行仿真验证，因为浮点加法器2条路径分别是由若干个小的功能模块组成，测试时按照自下而上、先小后大、逐级向上的思想进行仿真测试。针对FAR路径和CLOSE路径执行数据的特点分别编写测试激励，在遍历测试了各小部件且保证正确性后，再进一步验证各小部件间的逻辑连接正确性，在Modelsim环境下对采用该方法的双精度浮点运算的前导零预测电路进行代码覆盖率为100％的验证，结果表明该算法正确。同时对于其时延以及所占面积做了进一步的分析。最后对于本设计以及其中的研究重点做了总结，并且对于其中的不足和将要进行的改进提出了展望。

其他文献

CMOS图像传感器噪声抑制与多分辨率量化研究

CMOS图像传感器在许多领域中被认为是未来的成像器件，其不仅能满足工业及专业领域中严格的图像获取需求，而且还会对我们的日常生活产生深远的影响。CMOS图像传感器采用标准CMOS

学位

CMOS图像传感器噪声抑制多分辨率量化分析仿真分析可重构设计理论

应用于OC-192标准的锁相环倍频器设计

近年来，光纤通信已经广泛应用于高速率、大容量的数据传输中。OC-n标准定义了一系列可以在SONET上传输的数字信号，其中OC-192标准的速率达到了10Gbps。光纤通信发射机中的

学位

OC-192标准锁相环倍频器鉴频鉴相器环路滤波器相位噪声光纤通信发射机

SrGAP2分子F-BAR结构域的可逆乙酰化修饰及其功能研究

SrGAP家族(Slit-Robo GTPase-activating proteins)主要有srGAP1、srGAP2、srGAP3和ARHGAP4四个家族成员组成。SrGAP分子包含N端F-BAR结构域,主要介导细胞膜形态的变化,中间

学位

srGAP2分子F-BAR结构域赖氨酸乙酰化修饰

单层与多层网络鲁棒性分析与优化

复杂网络充斥在人们生活的每个角落，时时刻刻影响着人们的生活，国内外学者从未停止对它研究的步伐。复杂网络的结构是交互信息和传输资源的载体，它的鲁棒性与否直接关系着国家的

学位

网络鲁棒性边攻击策略自然连接性模拟退火

超级干扰素的抗癌机理研究

第一章超级干扰素负调控Wnt信号通路的抗癌机理研究　　超级干扰素sIFN-I是一种新型干扰素，与普通干扰素IFNα-2b相比，超级干扰素抗SARS病毒效果高40倍，抗HIV病毒效果高1000多倍

学位

干扰素诱导新蛋白细胞浆定位蛋白酶体途径降解抗肿瘤转移

一款采用精确PSR的高功率离线式AC-DC转换器XD0798的设计

伴随着电力电子技术的飞速发展,开关电源技术得到了越来越广泛的应用,在众多领域里都成了不可或缺的一部分。在开关电源中,反激式开关电源具有设计简单,体积小,效率高的特点,其在小功率的电子设备与系统中被广泛地使用。在电子设备小型化、低成本的趋势下,反激式开关电源面对的挑战不断增加,如小型化、高可靠性、高设计灵活性、低成本等,这些都推动着反激式开关电源的不断革新。本文基于西安电子科技大学超高速电路设计与电

学位

PSR离线式反激式

自噬体相关蛋白p62抑制AAV2转导U87细胞的效应和机制探讨

腺相关病毒(adeno-associatedvirus，AAV)是基因治疗中最为有效且应用广泛的载体之一。AAV的细胞内转运过程是其在多种细胞和组织中转导效率不足的主要限制性屏障。内体的成熟

学位

腺相关病毒自噬体p62/SQSTM1蛋白RNA干扰基因治疗细胞转导

改进的协同量子粒子群优化算法及其图像分割应用研究

粒子群算法的局部搜索能力比较强,且算法中的相关参数容易控制及设置,然而,粒子群算法也有一些缺陷,例如易于陷入局部最优,即步入早熟状态。为了处理粒子群算法的缺陷,孙俊等

学位

QPSO算法反向学习机制动态因子柯西变异策略协同合作策略分区搜索多阈值图像分割

灯塔工厂的光芒

1月10日,世界经济论坛发布了新一批灯塔工厂名单,共有18家企业入选.其中有6家位于中国,分别是海尔、宝钢、福田康明斯、强生、宝洁、潍柴.至此,全球灯塔工厂网络已拓展至44家

期刊

RBPL-1对秀丽线虫发育及育性影响的研究

视网膜母细胞瘤结合蛋白(RBBP family)是一类能结合视网膜母细胞瘤蛋白（RB）的蛋白家族。RBBP6是这个家族中的一员，但他除了能结合RB以外，还能结合著名抑癌蛋白P53。RBBP6含有从低

学位

视网膜母细胞瘤结合蛋白抑癌蛋白秀丽线虫多聚腺苷酸

快速浮点加法器的优化设计

其他学术论文