面向众核处理器的动态粒度内存系统设计与分析

来源 :北京大学 | 被引量 : 0次 | 上传用户:njsnw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代的众核处理器/协处理器往往具有强大的计算能力,这使得有效的内存带宽通常成为了众核计算系统性能的瓶颈所在。为了缓解内存带宽不足的问题,现在的计算机系统普遍采用较大的缓存以及较宽的内存访问接口和粗的访存粒度来增加单个内存通道的有效内存带宽。在一些大型的服务器中,也有通过配备多个较窄的内存通道从而增加总的有效内存带宽的实例。粗访存粒度在大规模科学计算型应用中有较好的表现,较高的缓存命中率使得大部分预取到缓存中的数据能够被后续指令访问。而在访存目标相对发散的应用中,比如图搜索以及事务型处理的应用,粗访存粒度由于数据局部性较差而不能得到充分的利用,从而使得有效的内存带宽降低。多个窄的内存通道虽然能够为访存发散的应用提供较高的有效内存带宽,但是其成本过于高昂,不适用于大多数的计算场景并且不具有好的可扩展性。  本文提出一种基于并行细粒度访存技术的面向众核处理器的动态粒度内存系统(或称为动态粒度众核内存系统)。本文提出的并行细粒度访存技术通过增加少量的简单器件,如锁存器,多选器,改变传统双联内存模块(DIMM)的拓扑结构,使其既能够支持传统的粗粒度访存请求,也能够为细粒度访存请求服务。这种总线共享设计使得在不增加总线的前提下,多个细粒度访存请求能够被并行化,从而进一步提高了动态粒度内存系统在细粒度访存模式下的性能。基于并行细粒度访存技术,本文提出的动态粒度众核内存系统根据程序执行的历史对程序的局部性特征进行预测,从而自主的调整访存的粒度,在粗粒度访存模式和并行细粒度访存模式之间进行切换。  本文给出并行细粒度访存技术以及动态粒度众核内存系统详细的设计,包括基于DDR3时序要求的操作时序以及内存模块外围的逻辑电路设计,缓存设计以及局部性预测方法和访存调度算法。本文使用开源模拟器multi2sim以及DRAMSim2对所提出的系统进行模拟,在多个标准测评程序集上进行性能测试,发现本文提出的动态粒度众核内存系统能够对于发散访存应用的有效内存带宽带来两倍以上的提升,并且在科学计算等规则访存应用中也能保持原有的带宽不损失。  
其他文献
电子表单是一个公开的元数据独立集合,它定义了表单通过计算机软件实现的方式,包括在计算机平台上的外观、行为和操作方式.HTML表单从1993年发明至今作为主要的电子表单标准
本文的研究内容属于图像处理领域中的图像分析范畴.首先,基于位图的内部结构和处理技术,实现了真彩色位图与灰度位图之间的转换;其次,利用差分法和LMS自适应滤波检测法对静止
信息安全始终是计算机科学技术领域引人注目的重大问题.在网络技术迅速发展、广泛应用的今天,信息安全问题表现得尤为突出.概括而言,信息安全就是要确保在网络中传输和存储的
随着计算机技术以及人机交互手段的发展,虚拟现实技术应用正逐步渗透到各行各业。三维场景编辑是虚拟现实技术中一个重要的研究内容。现有的很多虚拟现实平台都提供了对于三维
软件复用是当前软件工程研究的重要课题.如何正确识别和组织可复用信息,使它们在软件开发中容易被复用是一个重要的问题也是一个难点.领域工程覆盖了建立可复用的软件构件的
现代医学科学的精细化发展,使医院分科越来越纷繁复杂,越来越精细。当身体出现不适症状而想挂号就医时,面对医院的科室设置,经常会发生不知挂哪个科室,哪个专家号的情况,由此产生“
高层体系结构(HLA)旨在建立一个通用的高层仿真体系,增进仿真应用程序之间的互操作性和提高部件的可重用性.实时性和稳定性是分布式虚拟现实系统的两个基本要求.论文从以下三
定位技术是无线传感器网络的一种支撑技术,而应用创新是物联网的核心内容。本文主要面向应用研究基于WSN的区域定位算法,以此为基础设计并实现定位系统。近年来,随着社会对定位
可扩展集群技术是支撑未来不断增长的应用需求、降低高性能服务器软硬件和管理成本的主要形式.IBA的特色就是其可扩展性,它支持不同厂家产品的互操作.该文从拓扑结构、通讯机
该文在分析现有的主流Web服务流程描述语言描述能力的基础上抽象出一个与具体流程描述语言无关的中间流程表示模型,设计了一个可扩展的流程描述生成框架来支持从中间流程模型