ESCA高性能处理器控制内核的研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:uuuuurzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合计算架构采用异构处理器,充分挖掘不同架构处理器的体系结构优势,分别对控制密集和计算密集型任务进行优化处理,协同实现对应用的加速,已成为高性能计算体系结构的重要发展趋势之一。本项目组基于混合计算思想,面向工程科学计算和多媒体领域应用设计了一款高性能多核处理器-ESCA(Engineering and ScientificComputing Accelerator)。ESCA处理器以协处理器的形式对应用中计算密集型任务进行加速,采用SIMD/Vector/Sub-word等技术实现高性能。ESCA处理器由控制内核和计算阵列两部分组成,本课题主要围绕控制内核的关键技术研究及其实现展开。本文首先从ESCA系统的角度介绍相关模型,然后阐述了ESCA处理器的指令集、硬件框架和存储组织等体系结构关键知识。在此基础之上,确定控制内核的具体功能职责并定义了微体系结构。控制内核指令集采用分层编码,扩展控制指令以支持特殊控制流。针对大规模规整数据传输进行优化,提出了显式存储访问机制。硬件实现以流水线为主线,力求性能与开销的折衷。采用软硬件协同验证方法对控制内核的复杂控制流进行验证,设计了混合验证平台,自动化的验证流程极大地缩短了验证周期。最终的ESCA处理器设计进行了硅原型实现,工作频率为250MHz,总面积为17676582.00μm~2,其中控制内核面积为3107821.56μm~2,硬件开销比例为17.58%。以DGEMM为评测程序,对系统实现的显式存储访问机制进行了性能评测,存储访问延迟隐藏能够达到运行总时间的56%,并获得1.5倍的加速比,表明该机制可有效弥补计算与存储访问间的速度差异,提高系统计算效率。
其他文献
摘要:我们历时近三年的时间完成了一个国家级教科研课题的研究——“提升中小学生英语阅读效率的教学策略对比研究”。我们对课题采取了多種研究方法,如实验研究、问卷调查、访谈、课堂观察、日志跟踪等方法。此课题为全国教育科学“十二五”规划教育部重点课题,其研究的目的是:一方面是为了适应新课程改革全面推进素质教育,改变英语课程过分重视语法和词汇的讲解与传授,使语言学习的过程成为学生形成自主学习能力的过程。另一
期刊
随着电子系统尺度的持续缩小,器件尺寸不可避免的会达到它的物理极限。纳电子技术作为新兴的技术,在器件集成密度、速度以及功耗等方面将比传统CMOS技术有显著提高。但是,由于极
正月十二,中午.窗外,万物吐绿,大街上行人稀少,路边停车位的汽车排着长龙,没有了往日的熙熙攘攘,偶尔几只小鸟飞过,更显冷清了.本是新春节庆正浓,喜气洋洋的时节,却被这场突
期刊
当今片上系统SoC中嵌入存储器越来越多,所占芯片面积越来越大,存储器的高集成度特点决定了其出现故障的概率比一般电路要大的多,在SoC中存储器故障是导致芯片成品率下降的一个主
今年1月召开的中纪委四次全会,是在决胜全面建成小康社会、决战脱贫攻坚的关键时刻召开的一次重要会议.习近平总书记在全会上的重要讲话,站在实现“两个一百年”奋斗目标的历
期刊
年初十六的早晨五点多,天还暗着,妻子的闹钟响了,她起来为我做早点,好让我赶最早一班去省城的动车时不会饿肚子.rn因为新冠疫情的缘故,大家都很担心,仿佛空气里弥漫着病毒,时
期刊
  戊型肝炎病毒(HEV)是引起传染性急性戊型肝炎的病原体。通过同源比对四种基因型的戊型肝炎病毒序列,选取其保守序列部分设计两对槽式聚合酶链式反应的简并引物,并建立了一
“嫦娥一号”探月卫星携带的微波探测仪(CELMS)是世界上首次在月球轨道上对月球进行观测的被动探测器。CELMS有四个工作频率:3.0,7.8,19.35和37GHz,通过多通道微波辐射亮温研
移相器被广泛应用在雷达、通信、电子对抗等领域,特别是在相控阵雷达天线中应用最为普遍。移相器的插入损耗、带宽、尺寸、功率容量和稳定性等指标对系统总体存在重要影响。