高性能片上末级高速缓存管理策略研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:jjuuhhuu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路制造工艺的快速发展,处理器和主存之间的性能差距越来越大。为了填补该性能差距,现代处理器已经把芯片上一半以上的晶体管用于实现多级片上高速缓存。其中片上末级高速缓存作为片上高速缓存层次结构中的最后一级,其在失效时仍然需要花费几百个处理器时钟周期来访问片外存储。对于SPECCPU2006中的存储密集型程序,片上末级高速缓存失效时间平均占处理器总执行时间的37.9%,因此片上末级高速缓存的性能对处理器的整体性能至关重要。传统高速缓存管理策略主要针对一级高速缓存的访存特征来进行设计,它们无法有效管理片上末级高速缓存。因此如何通过高效管理片上末级高速缓存来提高系统性能就成为了计算机系统结构领域中的一个重要问题。并且随着程序工作集的不断增大,片上末级高速缓存管理策略的重要性不断提高。本文面向典型的超标量处理器设计,分析了现有片上末级高速缓存管理策略存在的问题,并针对这些问题提出了低开销的解决方案,从而达到高性能的片上末级高速缓存管理策略设计目标。本文的主要内容和贡献包括:  (1)提出了一种基于最优旁路算法的旁路策略。旁路策略通过不为局部性差的块在末级高速缓存中分配空间来避免上述块对末级高速缓存的污染,从而提高性能。理论上的最优旁路算法具有与最优替换算法相近的性能,但是由于需要未来的信息而无法实现。本文提出一种通过学习和预测最优旁路算法的行为来指导是否使用旁路的技术,最优旁路监测器。最优旁路监测器记录失效时产生的进入块和替换块对,通过监测这些对中进入块和替换块的访问顺序来判断最优旁路算法对这些对的行为,并使用预测表记录监测的结果。在失效时,该技术根据预测表记录的最优旁路算法的近期行为来指导是否使用旁路。本文技术可以和多种替换算法联合使用,实验结果表明该技术在使用较少的额外硬件开销的情况下可使处理器的单线程和多线程性能分别提升9.7%和8.9%。  (2)提出了一种面向包含型末级高速缓存的替换策略。由于包含型高速缓存层次结构可以简化高速缓存一致性的实现,因此在现代处理器中被广泛使用。但是为了保证包含性需要牺牲一定的性能,并且很多新近提出的高性能替换策略无法适用于包含型末级高速缓存。本文提出了一种基于两级替换优先级的包含型末级高速缓存替换策略。除由基础替换算法提供的替换优先级以外,该策略为末级高速缓存块额外附加了一级替换优先级。当一个块被装入末级高速缓存时,该策略通过预测它的局部性来相应地设置该优先级。当一个拥有高替换优先级的块不再位于内部高速缓存中时,它将优先被末级高速缓存换出。通过这种方式,末级高速缓存可以保留更多局部性好的块来提升性能,同时避免了提前换出内部高速缓存中局部性好的块。本文实验结果表明对于容量为512KB的包含型末级高速缓存,该策略的平均性能提升是其他技术的3倍以上。  (3)提出了一种面向互斥型末级高速缓存的旁路策略。互斥型末级高速缓存中因为不需保存内部高速缓存中已有的数据,因此相比其他类型的末级高速缓存可以保存更多有效数据,从而在现代处理器中被广泛使用。互斥型高速缓存层次结构主要存在两个问题:首先末级高速缓存无法直接获得它的进入块对应的PC等信息来指导管理策略;其次互斥型高速缓存层次结构要求所有内部高速缓存换出的块都要发给末级高速缓存,从而增加了片上互连网络的通信量。为此,本文提出了一种面向互斥性末级高速缓存的旁路策略。该策略为每个内部高速缓存块保存其对应的PC,并在替换时把该信息传递给末级高速缓存以指导其旁路决定。同时如果被旁路的块不为脏,那么该策略不把该块发给末级高速缓存以降低片上通信量。实验结果表明该策略可以在显著提高互斥型末级高速缓存性能的同时平均减少7.1%的片上互连通信量。  (4)提出了一组基于保留价值的末级高速缓存管理策略。在现代处理器系统中,由于访存延迟可变,并且处理器对于高速缓存不同失效的容忍能力也不同,使得不同高速缓存失效对处理器的性能影响存在较大差异。因此,高速缓存管理策略应该能够感知失效代价的差异。为达到该目的,本文首先提出了保留价值的概念。一个高速缓存块的保留价值由所有访问该块的请求所决定,既包括在访问该块失效时处理器的性能损失,也包括在访问该块命中时处理器的性能收益。然后基于保留价值的概念,本文提出了一组以最大化高速缓存中块的整体保留价值为目标的高速缓存管理策略。通过优先替换保留价值较低的块,这些策略使高速缓存能够保留更多高保留价值的块,从而改善性能。本文实验结果表明相比其他技术,基于保留价值的管理策略可以显著降低末级高速缓存的总失效代价,从而提高性能。
其他文献
组合预测是一个非常有用的技巧来分享每个预测方法的强度,文中提出了一种变权值的组合预测方法AFTER算法,这种方法根据每个预测方法的性能分配权值,并且依赖Y的条件分布来分
随着以计算机和互联网为核心的信息技术的长足发展,视频的获取、处理和传输方式逐渐实现了数字化,促进了视频内容的极大丰富。当前,数字视频技术继续朝两个方向发展:一方面是视
CORBA技术因其出色的跨平台、多语言支持等特性成为分布式应用系统的开发平台和支撑框架,在电信、制造、金融等许多领域得到了广泛的应用。但是CORBA存在着一些固有的缺陷,其中
聚类是指根据事物的特征对其进行聚类,即所谓的"物以类聚",是最重要的数据挖掘技术之一.除传统的聚类方法外,近年来模型聚类、神经网络聚类方法也有了长足发展.聚类在众多领
交通是维系人类生存发展的命脉,其功能是实现人和物空间位置的有序移动.近半个世纪以来,随着城市化进展和汽车普及,交通与需求、交通与环境、交通与能源之间的矛盾日益加剧.I
进入21世纪,伴随着嵌入式系统网络化、多功能化的发展,嵌入式网络软件开始被广泛应用到嵌入式系统中,以满足各种网络通讯需求。嵌入式邮件客户端,作为一种重要的嵌入式网络通讯软
鉴于分布式应用计算模型的复杂性和异构性,其开发仍然是研发人员需要面对的一个主要问题.在这些分布式应用中,数据的多样性、冗余和不一致,带来了诸如互操作性和信息共享的一
随着互联网越来越深层次地改变人们的生活,Web安全一直受到各界关注,也是信息安全领域的重要研究课题。SQL注入攻击是Web安全领域历史最悠久、使用最广泛的攻击。虽然已诞生十
RFID(Radio Frequency Identification)射频识别技术,是一种采用无线射频方式进行非接触双向数据通信,对目标加以识别并获取相关数据集的技术。因为其具有不需要人工干预、不
该论文综合运用图像处理和模式识别技术,比较深入地研究了自动指纹识别技术.全文内容共分五章.第一章绪论;第二章指纹图像预处理;第三章指纹分类;第四章基于分类的匹配;第五