基于不对称性的相变存储器性能优化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhangyang_8591
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据规模的爆炸式增长,大数据处理对于主存系统性能、容量、能耗等的要求越来越高。数据密集型应用需要大量的主存空间,有研究表明大规模计算所需要的主存容量将会是现有系统主存容量的1000倍。现有主存系统主要是基于动态随机存储器(Dynamic Random Access Memory,DRAM)技术,由于DRAM器件特性以及工艺的限制,基于DRAM的主存系统面临存储墙、性能墙以及功耗、可扩展性等方面的挑战,在低工艺制程下很难维持稳定性同时继续保持可扩展性。以相变存储器(Phase Change Memory,PCM)为代表的新型非易失性存储器(Non-Volatile Memory,NVM)为解决上述问题提供了可能。NVM具有非易失性,并且具有更好的可扩展性以及更低的静态功耗,是DRAM技术的有力竞争者。在众多NVM技术中,PCM研究较为成熟,距离产业化也更近,是NVM研究热点之一。然而PCM自身也面临一些问题,尤其是较差的性能与较低的耐久性限制了其在主存系统中的大量应用。如何提升PCM主存访问的并行性以及性能是现有PCM研究中的热点与难点。PCM每比特写入功耗较高,由于电源模块限制,其所能并行写入PCM主存的数据量是受限制的。最后一级缓存与主存之间进行数据交换的粒度是缓存行,而缓存行的大小远大于主存写单元的大小,因此需要若干个写单元来完成一个缓存行的写入。这些写单元几乎都是串行执行的,极大地限制了系统性能。针对这一问题,提出了一种基于写入数据类型不对称性的SLC(Single-Level Cell)PCM写优化技术Min-WU。通过对多线程应用负载主存访问特性的分析,发现主存访问呈现明显的访问局部性,一小部分数据类型占据了绝大部分的主存访问。Min-WU的核心思想是对频繁出现的数据类型进行压缩来减少数据总量,然后在功耗预算的限制下,将压缩之后的数据单元进行重调度,将更多的数据封装到一个写单元中以最小化写单元的数量。实验评估表明与常规写方案相比,Min-WU减少了44%的读延迟,28%的写延迟,32.5%的程序执行时间和48%的能耗,并得到32%的IPC(Instruction Per Clock)提升。利用PCM写“0”写“1”功耗的差异,提出了一种基于写入功耗不对称性的SLC PCM写优化技术MaxPB。通过分析发现,现有的PCM写入方案面临功耗预算利用率低的问题,功率被过度供应但是没有得到充分利用。MaxPB通过在写入时添加“写前思考”阶段,根据实际的功率需求对所有数据单元进行重排列,并在功耗预算限制下对数据单元进行高效调度,使用最少的写单元处理全部数据的写入,从而提升写入并行性并显著减少写服务延迟。实验评估结果表明MaxPB方法可以兼顾写入效率与写入性能,相对2-Stage-Write方法,MaxPB可以减少20.3%的读延迟,16.1%的写延迟以及15.6%的程序执行时间。通过对主存数据访问特性的深度挖掘,分析发现主存访问特性呈现出显著的写入数据数目不对称性,即写“0”写“1”数目的不对称性,大部分的负载是写“1”占主导的。据此提出了一种基于写入数据数目不对称性的SLC PCM写优化技术Tetris Write。Tetris Write的核心思想是监控每个数据单元中“0”和“1”的数目,并且利用数据单元中写“0”和“1”的数目不对称性,尝试首先安排数据单元中占主导的写“1”操作,并充分利用写“1”剩余的功耗预算以放置数目较少并且延迟低的写“0”操作,利用执行时间较长的写“1”阶段来掩盖执行时间较短的写“0”阶段,从而提升写入并行性并减少写单元数目。实验评估表明Tetris Write相对基准方案可以减少65%的读延迟,40%的写延迟,46%的执行时间并获得2倍的IPC性能提升。现有的主存组织方式导致了芯片级数据不均衡的问题,即一部分PCM芯片承担了大部分的写入数据量,数据量较少的芯片必须等待处于忙状态的芯片完成数据写入,造成了极低的主存并行性以及较高的主存访问延迟。针对这一问题,提出了一种基于写操作数据分布不对称性的MLC(Multi-Level Cell)PCM写优化技术PCM-2R。PCM-2R的核心思想是通过修改字节分布模式将写数据布局重塑,使得修改字节均匀分布在所有芯片中,从而均衡各个芯片写数据量。然后将MLC PCM物理单元进行解耦,利用MLC PCM状态转换的不对称将物理行分为快写以及慢写两个区域,将重塑后的数据重映射到快写区域以进一步地加速写入。测试结果表明PCM-2R相对基准方案实现了55%的读延迟,32%的写延迟以及51%的能耗减少,并获得2.1倍IPC性能。
其他文献
阐述了水煤浆气化装置在运行过程中,高压煤浆泵多次出现不打量造成气化炉过氧和跳车问题的分析和总结,通过采用煤浆自动跟踪系统,快速克服因煤浆泵不打量而造成的煤浆流量大幅扰
【正】 浙江是一个经济大省,又是一个资源穷省。与其他省份相比,浙江的资源禀赋,最起码在自然资源禀赋上并无特别优势。浙江人多地少,人均耕地仅及全国平均的48%,“七山二水一
成长小说通过主人公的遭遇和经历折射出青少年思想的形成以及性格变化的心路历程。二战后美国经济急剧发展。但是,伴随着物质文明的高度发达却是人们在精神需求层面的匮乏,尤其
本刊讯据统计,2010年从广西防城港口岸出口磷化产品1573批次,重量209kt,货值15678万美元,与上年同期相比分别增加38.7%、35.2%和59%。防城港市的磷化产品主要出口韩国、泰国、中国台湾
2月6日,南阳市召开科技暨人才工作会议,省科技厅副厅长刘英锋及南阳市领导出席会议.市委书记张文深强调,突出高质量发展这一根本方向,紧扣重要区域中心城市建设,围绕推动“两
受全球政治、经济等多种因素影响,国际国内洗钱活动的规律和反洗钱工作形势正在发生巨大变化,在当前反洗钱国际评估标准和监管更加严格的形势下,我国反洗钱工作也面临新的挑战,积
报纸
组织滴虫病也称为黑头病、传染性盲肠肝炎,是由原虫感染火鸡和鸡的盲肠进而感染肝脏而引起的,偶尔也发生在其他鸡形目禽。本病主要表现为下痢(排淡黄色或淡绿色粪便),盲肠发
以微米二硫化钼(micro-MoSz)和纳米二硫化钼(nano—MoS2)为催化剂,在一定温度(250℃)和一定压力(2MPa)下,在间歇反应釜中进行生物质油的催化加氢实验,考察了不同粒径二硫化钼对生物质油
本研究探索从活体黄颡鱼样本提取DNA。取黄颡鱼的尾鳍,背鳍,肝脏,血液,胡须样品,加入蛋白酶K,55℃消化至透明,采用Tris-酚的方法提取DNA。此外,用氯化钠的方法提取胡须DNA作
母羊难产时都会表现出烦躁不安,时常回头顾腹及阴部,阴道流有胎水与污血的浑浊粘液,阴唇湿润松弛,阵缩及努责等现象,并长时间不能自主产出小羊,使母羊阵缩减弱,精神变差,呼吸与心率加