基于程序数据流图分类的加速器设计方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wtbcgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不断增长的片上晶体管数量和功耗预算的上限限制造成了“利用率墙”问题的出现。为特定应用和算法设计加速器被认为是提高效能、缓解“利用率墙”问题的重要方法之一。然而,当前大部分设计方法都是针对于某个应用或者算法,严重限制了加速器的适用性。  本文研究了基于程序数据流图的加速器设计方法,提出了一种面向通用计算需求的多加速器架构,主要包含如下内容:  (1)提出选择热点区域数据流图子图作为加速对象,设计并实现了程序热点区域数据流图提取工具。本文首先开发了基于LLVM编译框架的数据流图提取工具,能够获得程序执行时间最长的区域以及对应的数据流图。选择SPEC CPU2006里面的17个测试程序作为程序分析工具输入,最后得到了311个数据流图。  (2)采用Similarity Flooding算法评估数据流图间的相似度,并根据AgglomerativeClustering算法进行聚类分析。由于硬件设计复杂度和片上资源的限制,需要将数百个数据流图加以分类。本文基于经典的Similarity Flooding算法分析了数据流图并得到相似度矩阵。然后,采用Agglomerative Clustering自底向上的聚类算法将数据流图分成15类,同时评估了聚类效果。  (3)根据典型数据流图,设计15个可重构的硬件加速器。本文从每类中选取典型数据流图,并分别设计了类似CGRA架构的可重构硬件加速器。其功能单元的操作类型和路由器互连方式可在程序运行期间动态配置,消除数据流图微小差异对于程序代码在加速器映射上的影响。  (4)完成了多加速器架构设计和仿真。本文设计了基于总线互连、共享一级Cache的多加速架构。15个加速器作为处理器流水线的一部分与通用处理器核集成。最后,基于SimpleScalar仿真平台,通过ARM指令扩展,完成了多加速器架构的仿真。实验结果表明,相比于没有集成加速器的ARM处理器,基于程序数据流图分类的多加速器架构能够使得SPEC测试程序有6.2倍的平均加速比。
其他文献
非同义替换率(Ka)和同义替换率(Ks)对于重建系统发育以及揭示编码蛋白的进化过程有着非常重要的作用.由于Ka表示单个非同义位点上发生非同义的替换数,Ks表示单个同义位点上发
中国老龄化程度正逐步加深,社会空巢老人现象严重,老年人的健康安全问题引发社会关注。据调查,跌倒是致老年人伤害死亡的首位原因,而老年人走失的案例更是屡见于新闻,因此实现一套
目前计算机软件的规模越来越大,复杂度也不断提高,软件错误造成的后果也就越来越严重,软件的质量和可靠性已引起人们的高度重视。在现代软件工程中,软件开发的各个阶段,都应进行相
在大数据背景下,空间分析作为地理信息服务的核心,呈现出两种主要发展趋势。一是大规模空间数据的精确分析。随着空间数据采集技术的进步,人们可以获得的空间更加广泛,空间数据规
目前,互联网应用环境日益复杂,安全危机频发。网络上的个人计算机随时都可能遭到各种恶意攻击,这些攻击导致的后果可能是上网账号被窃取,银行账号被盗用,电子邮件密码被修改,财务数
随着GNSS(Global Navigation Satellite System)现代化的建设和全球定位技术的不断发展,卫星导航产业也在迅速地发展,并已经成为人们生活中不可或缺的组成部分。随着人们对于GN
IP组播技术是一种有效的多目标传输机制,具有广阔的应用前景。但是目前的组播协议缺乏安全机制满足组播应用的安全性要求。IP组播是一个开放的系统,每一台主机都可以通过发送:IG
超并行处理(Hyper Parallel Processing,HPP)体系结构是国家智能计算机研究开发中心提出的一种新的面向千万亿次计算的超级计算机体系结构.它在保持了系统较高的扩展性的同时
近年来,移动智能设备如手机、平板电脑等,变得越来越普及,随着移动互联网的发展,人们接入网络也越来越方便和迅速。此外,越来越多的人选择分享自己生活经历相关的图像到社交网络,这
随着高等教育规模的扩大,学分制的实施,教学管理工作变得越来越复杂。为了适应新的教学模式提高教学管理的工作效率,各高校都相继开展了教学信息化建设,建立了自己的教学管理信息