基于存储区域的TLB研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：qq104397622

【摘要】

：

现代处理器中转换旁视缓冲（Translation Look-aside Buffer，TLB）通常由相联存储器实现，对相联存储器的访问会造成较大的功耗开销，并且需要较长的延迟。32位处理器向64位处理器的升

【作者】

：

谢劲松

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2010年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现代处理器中转换旁视缓冲（Translation Look-aside Buffer，TLB）通常由相联存储器实现，对相联存储器的访问会造成较大的功耗开销，并且需要较长的延迟。32位处理器向64位处理器的升级加剧了TLB的功耗和访问延迟问题，同时增加了TLB失效的性能损失。本文基于粗粒度的存储单位--存储区域研究与设计低功耗、低延迟和高性能的TLB，为解决64位处理器中TLB设计面临的突出问题提供了新的方案。本文的创新点主要有：　　（1）统一了片上存储系统优化的存储单位。一方面，将存储区域从物理地址空间引入到虚拟地址空间，使得存储区域成为了包括物理存储和虚拟存储在内的整个片上存储系统优化的基本单位。另一方面，本文基于存储区域对TLB进行优化，并不只是针对某一方面的优化，而是提出了一个整体的优化方案，使得TLB在功耗、面积、访问延迟、功耗密度和性能等方面都有所改善。　　（2）研究与设计基于存储区域的低功耗、低延迟的数据转换旁视缓冲（dataTLB，dTLB）。提出一种能够减少标签宽度的新dTLB设计，从而降低dTLB比较查询的功耗和减少比较查询的延迟。这种新的设计源于这样的观察：dTLB的标签代表着很大的存储区域，比TLB本身保存的基页要大得多。在标签比较之前，采用少量的几位标识来表示冗余的标签高位，这种区域的编码与回收只有少量的时间与功耗开销。与此同时，采用将基址高位当成虚拟地址高位的地址推测技术以防止性能的降低。实验表明，与参考dTLB相比，新设计的平均动态功耗降低了56.24％、访问延迟减少了8.59％、面积减少了34.28％、功耗密度降低了33.41％，而性能几乎保持不变。　　（3）研究与设计基于存储区域的低功耗、低延迟的指令转换旁视缓冲（instruction TLB，iTLB）。经实验观察到，在相当长的指令运行期间，指令存取的虚拟存储区域数量是非常有限的，并且区域之间的切换也是非常少的。在iTLB结构中，保存的虚拟基页仅仅分布在少量几个存储区域内，采用编码技术，用极少数几位来表示少量的几个存储区域，从而减少了iTLB结构中CAM的大小；同时，区域之间切换少表明指令在很长一段指令运行期间，集中在一个区域内运行，即下一条指令与上一条指令都在同一个区域而不发生跳转，这样就可以采用重用技术。与参考的iTLB相比，新设计的平均功耗降低了62.84％、访问延迟减少了9.99％、面积减少了44.92％、功耗密度降低了33.59％，而平均性能只降低了0.23％。　　（4）研究与设计基于存储区域的页表表项缓冲，以提高TLB的性能。在层次式页表系统中，采用硬件方式处理TLB失效的处理器，其TLB失效损失与页表的层次数目成正比。32位地址空间升级到64位地址空间，页表层次将增加一到三级，TLB失效后访问内存的次数随之也增加一到三次，使得从TLB的性能损失严重增加。将存储区域概念引入到TLB失效处理，设计页表表项缓冲，保存每次访存得到的页表表项内容，减少了TLB失效访存的次数，减少了失效损失，从而有效地提高了处理器的性能。

其他文献

一种多格式视频熵解码模块的设计与实现

熵解码是视频解码的核心算法之一。随着高性能编解码标准的出现和高清晰度视频的应用,熵解码处理的数据量和计算复杂度大幅增加,采用软件处理的方法难以满足多种格式高清视频

学位

视频熵解码多格式解码可变长编码上下文自适应码流检测MPEG-2标准

一种基于整数变换的可逆水印算法

可逆数值映射(reversible contrast mapping,RCM)是早期可逆水印算法中比较经典的基于整数变换的算法,本文进一步扩展了RCM可逆水印算法并进行了改进,由传统的两点组扩展到任

学位

信息隐藏可逆水印整数变换可逆数值映射

可信硬件平台研究

随着计算机的普遍应用和网络技术的迅速发展,计算机深刻地影响了社会经济生活各个方面。由于计算机的体系和计算机网络都采用开放式的结构,在结构上存在着安全缺陷,因此引发

学位

基于多链路的DNS算法研究与实现

BIND是目前最流行的DNS服务器软件。版本9的BIND重新写了底层实现,进一步的提高了DNS的安全性和可靠性,新的多线程架构也对多处理器硬件提供了更好的支持。　　但是当从本

学位

智能链路选择主动测量否定缓存多线程架构校园网

支持通信的嵌套并发事务内存机制及其语义

并发环境中共享对象的互斥访问是并发系统设计与管理需要着重考虑的问题。事务内存(Transactional Memory)是近年来提出的一种解决这类问题的方法。其中,Harris提出一种软件

学位

软件事务内存嵌套并发Haskell语言语义网络事务日志

面向公共上机实验环境的个性化便携虚拟机

在公共上机实验环境中，每台计算机都安装有固定的操作系统和软件，学生不能自由添加删除程序，学生的私人数据文件只能保存在计算机的公共磁盘或网络磁盘上，没有独立性和安全性，容易

学位

个性化便携虚拟机公共上机实验环境操作系统KVM虚拟化QCOW2镜像格式snapshot技术

实时图像比对算法设计与实现

在印刷过程中,印刷品质量的好坏取决于与预先设计的印刷图案是否一致。在基于机器视觉的印刷品质量检测方法中,先由相机等设备将印刷品拍摄并传输到计算机中,再由计算机对印

学位

图像比对算法图像配准印刷品质量检测图像特征提取缺陷检查

一种区域RFID编码解析服务系统及管理工具集的设计与实现

目前RFID技术及应用已成为国内外研究热点。但绝大多数RFID应用仍是闭环应用,其关键原因在于,缺乏一套可靠高效的RFID公共服务基础设施和信息共享机制。RFID编码解析服务是核

学位

电子标签编码规范解析服务查询代理

基于视觉显著度的视频编码优化技术研究

随着视频编码技术的不断深入,传统编码技术更多地和诸如心理学和认知学等领域的知识结合起来,以便得到更好的视觉效果。近年来,随着生物学、心理学的发展,关于视觉显著度的研

学位

视觉显著度视频编码优化结构相似度指标频谱残差H.264/AVC码率控制

基于分布式缓存的CALIS数字对象存取系统的设计与实现

随着信息技术的不断发展,数字图书馆慢慢成为人们获取信息和知识的重要途径。数字图书馆能提供的信息和知识的载体也由最初的简单的文本,发展到现在多种多样的音频、视频、图

学位

分布式文件系统多级缓存数字对象关系预载入替换策略权限管理

基于存储区域的TLB研究

其他学术论文