Cache低功耗研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:bosimao_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当代计算机系统中,存储器的速度与处理器速度相差甚远。Cache技术基于程序的局部性原理(应用程序的访问地址在某一时间段具有空间上和时间上集中分布的倾向),是主存和CPU通用寄存器之间插入一个容量相对较小的高速的存储器,把程序正在使用的一部分数据或指令从主存调入一个与CPU速度相当的容量较小的存储器,方便CPU在这段时间内调用。这极大提升了程序的运行速度。这个介于主存储器和CPU之间的小容量高速存储器就称作高速缓冲存储器(Cache)。然而当代集成电路集成度仍然按照摩尔定律不断的增长,芯片的面积越来越大,相应的消耗的功耗也越来越大。随着CPU访存速度的加快,片上Cache的面积也越来越大,Cache算消耗的功耗就在总功耗中占了相当重要的一部分。Cache低功耗技术越来越不容忽视。   本文首先是对Cache的整体综述,包括Cache的映射规则、查找方法、替换算法、写策略和一致性;再就是关于高性能低功耗Cache的相关研究。高性能低功耗Cache的研究可分为四类,分别为基于FilterCache的方法、基于路预测技术的方法、对标识符比较进行改进的方案、基于可重构Cache的方案,例外还有一些其它低功耗方案。   在不改变Cache原有结构的基础上本论文提出了一种新的算法—路追踪算法(WTSA),该种结构的Cache成为WTSACache。通过在传统组相连Cache结构中加入路追踪表(WTT表)实现对数据块有效位的分散存储,对Cache进行访问时,只访问哪些最有可能包含所需数据块的路,排除那些根本不可能的路。发生命中时,对与四路组相连Cache功耗最低能降到原来的1/4,八路组相连Cache功耗最多能较低要原来的1/8。   本论文对Simplescalar模拟器中的Cache.h和Cache.c文件进行了详细分析,在基于Simplescalar模拟器和Wattch模拟器的基础上对SPECCPU2000进行了模拟实验,所需配置为容量大小为512KB,相连度为8,块大小为64B的二级Cache,相比于传统组相连Cache平均功耗降为原来的20.8%。
其他文献
负温度系数(Negative Temperature Coefficient,NTC)热敏电阻材料是电阻率随着温度的升高呈指数规律降低的热敏材料,作为温度传感器的感温元器件,可广泛应用于温度检测与控制、
植物抗病基因所编码的蛋白能够帮助植物有效地识别自然界中各种病原菌的入侵,从而激发其自身的免疫反应,避免病原菌的危害。因此,其在植物对环境的适应性演化中发挥着十分重要的
细胞死亡对于多细胞生物体的生长发育和稳态平衡有着非常重要的作用,细胞的死亡方式多种多样,根据其形态学特点和分子调控机制的不同,主要分为细胞凋亡(apoptosis)、细胞坏死(ne
随着紫外光探测技术的发展,位于200~280nm的日盲紫外波段光探测日益成为人们研究的热点。由于高空臭氧等气体的强烈吸收,日盲紫外波段的光几乎不能透过大气层而抵达地面,因此只能
近年来,红外探测技术发展迅猛,热释电红外焦平面阵列因其非制冷、低功耗、宽光谱等优点而在红外焦平面阵列中倍受关注。弛豫铁电单晶PMNT是我国科学家在世界上率先发现的新型热
半导体器件特征尺寸的不断减小对纳米技术提出了更高的要求。特别是对于纳米器件,互连层的制作要求其结构尽量的薄和完整。因此,原子层沉积(ALD)技术固有的优势使其在纳米加工
线粒体是真核细胞的能量工厂,同时也参与了许多重要的生理活动。蛋白质组学技术的发展,有助于从整体水平检测线粒体蛋白质在各种生理、病理状态下的动态行为,对于线粒体生理功能
20世纪上半叶日益激烈的暹罗排华问题,深刻影响了中暹关系的历史走向。1935暹政府强行取缔华校,中国舆论鼓吹"民众外交"、"武力护侨"和"经济绝交"。付诸实践的抵制暹米运动,
本实验室李强发现新基因hurL的突变造成豌豆根瘤菌(Rhizobium leguminosarum bv.Viciae)生长缺陷,而且丧失了在天然宿主上结瘤的能力。豌豆根瘤菌HurL蛋白与细菌HU类蛋白家族
当今消费电子产品发展迅猛,种类各异,以其卓越的性能与便携性而深受消费者青睐。随着产品发展,人们越来越关注处理器的运算速度与系统的整体性能,而CPU需要先从存储器中取得数据