超标量处理器片上存储部件的低功耗设计技术研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:ustcer08005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以往的超标量处理器通过采用更先进的工艺、更高的主频、更多的晶体管数目提高性能水平,所付出的代价是处理器的高功耗。近年来,功耗的显著增长使得处理器设计不再以追求主频提升为主要目标,而更注重提高功耗效率。从主流超标量处理器的功耗分布来看,由RAM和CAM构成的片上存储部件所占的功耗比重最大。如何改进这些关键性的存储部件并进行有效管理,在对性能影响尽可能小的前提下充分降低功耗开销是本文的主要研究课题。本文主要对超标量处理器中若干关键的片上存储部件进行研究,同时还充分考虑对同时多线程(SMT)技术的支持,主要的创新结果如下。 发射队列中CAM标签的唤醒逻辑是主要的功耗来源。本文从指令的待唤醒操作数数目分类与等待时延特性出发,提出采用两级缓置和自适应多体技术减少CAM标签和唤醒逻辑功耗开销,共享并平衡对发射队列资源的占用。实验结果表明,该方法可降低发射队列功耗的67%,IPC性能损失为1.9%,并且在发射级可以获得潜在更高的时钟频率,适用于SMT执行。 物理寄存器堆的多端口设计在提供峰值发射带宽需求的同时,也带来显著的功耗开销。本文基于对物理寄存器生命周期的划分和观察,提出利用小的辅助性结构管理一些活跃的寄存器值,分担主寄存器堆的访问压力,从而降低其端口数目和功耗。实验结果表明,该方法可降低寄存器堆功耗的42%,IPC性能损失为2.8%,不影响时钟频率。 Load.Store队列的CAM相联查找操作是主要的功耗来源。本文分析了Load-Store队列相联查找命中的充分必要条件,提出显式的利用年龄编码表示程序的顺序性条件约束,提高了基于计数器的Bloom过滤算法的过滤比率。实验结果表明,采用年龄编码的Bloom过滤算法,可将Load-Store队列总的功耗降低85%,在过滤比率和功耗节省上比基于计数器的算法提高5%。 随着工艺特征尺寸的减小,漏电流功耗显著增加。本文分析了负载程序在访问各数据Cache行的重用距离分布特性,结合DrowsyCache技术提出一种利用三态有限状态机的Cache漏电流控制策略。实验结果表明,基于重用距离的控制策略可以更好的适应负载程序在数据访问上的时间局部性,漏电流功耗降低了89%,比已有最好的策略多降低7%,能够限定漏电流功耗的上界,而对于性能的影响平均小于0.5%。
其他文献
传统的搜索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求。个性化服务技术就是针对这个问题而提出的,它为不同用户提供不
软件复用是解决软件危机、实现软件产业工业化生产方式的有效途径。软件复用活动包含两个相关的阶段:可复用软件资产的生产阶段和基于可复用软件资产的应用系统开发阶段。领域
电磁感应现象与人类生产生活密切联系,是高中物理教学的重点内容;更因为电磁感应与力、能量、电路等知识点有机结合,能很好的培养学生科学思维能力,多年来一直作为高考的压轴
二战后,美国在全球战略框架内形成了亚太安全战略.随着苏联的解体和冷战在全球层面的结束,亚太地区的战略格局和安全环境发生了重大变化,这意味着美国必须重新评估亚太地区的
俗话说:“万事开头难”、“良好的开端是成功的一半”.高中物理精彩导入是高效课堂的前奏曲,能扣住学生的心弦提高学习兴趣,使学生及时明确自主探究的目标,并主动打开创新思
当今世界,以信息通信技术为代表的科学技术革命,正在以前所未有的方式和速度改变着人们的生活与学习。其中计算机网络的发展尤为突出,已深入我们生活的方方面面,人类社会已经步入
自从实施新课改以来,广大高中物理教师积极采用多媒体教学、合作学习、探究性学习等科学的教学方法,逐步活跃了课堂气氛,充分发挥学生在课堂教学中的主体地位.从当前高中物理
高中新课程改革明确强调,课堂教学过程中一定要针对学生实际,坚持因材施教,立足学生的基础实施分层次教学.每一个班级学生的学习情况参差不齐,学生的基础有各不相同,学生的综
近年来,专利信息资源呈几何爆炸式的增长,如何充分地利用它们,使专利信息在科研和专利业务等方面发挥作用,成为文本处理领域的热门课题之一。专利信息资源中存在着大量的专业
作为中国近代著名数学家、教育家,近代高等教育奠基人之一,熊庆来有其独特的高等教育办学理念,并终其一生致力于我国高等教育的实践.熊庆来认为大学之重要在于其学术的生命与