用GPU加速Cache模拟

来源 :2007年北京地区高校研究生学术交流会 | 被引量 : 0次 | 上传用户:yiwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
处理器Cache技术在现有的系统中扮演着越来越重要的角色,Trace-driven的模拟器是评估Cache设计性能的重要工具。但是,基于CPU的串行Trace-driven Cache模拟器模拟需要耗费很长的时间,随着Cache研究的深入,这种低效的模拟器已经不能适应实际应用的需要。本文描述了一个用GPU加速单层单核Trace-drivenCache模拟器的低成本方法,它将Trace-driven Cache模拟算法和GPU的并行体系结构完美结合,并具有很好的并行性和可扩展性。文章对该模拟器的算法和实现进行了深入分析,并结合所使用的GPU的架构特点进行了进一步的优化。实验结果表明,得益于GPU的强大计算和并行能力,和基于CPU的Cache模拟器相比,基于GPU的模拟器具有明显的加速效果。
其他文献
增强现实技术将计算机生成的虚拟对象与真实世界进行融合,构造出虚实结合的虚拟空间,增强现实有三个关键技术:虚实结合、实时交互、三维注册。为了使增强现实系统的交互更加
本文分析了过程控制系统对实时传输的需求,针对网络传输开销的不确定性造成现有网络不能满足实时传输要求的现实,文章研究了共享内存技术,以此技术为基础实现了实时中间件。
会议
将Web Services技术应用到分布式网管中,提出了两种基于WebServices的网管模型,论述了其工作原理,Web Services接口要求,系统安全等。使得网管系统能以统一、标准的方式采集
作战仿真在现代军事训练中发挥着越来越重要的作用。本文提出的分队级作战仿真系统适用于城市巷战、反恐作战等分队级战术训练。文章介绍了平台的开发环境,阐述了该平台的功
移动IPv6协议是IPv6协议簇的一个重要组成部分,对其进行一致性测试有助于进一步完善移动IPv6协议的实现。本文提出了一种基于TTworkbench测试平台,用TTCN-3测试语言描述测试
本文提出了一种新的电影视频摘要的生成方法。此方法首先对镜头进行分割,然后对镜头进行聚类,然后通过对镜头分散程度的判别方法,生成最终的视频摘要。
质量是影响软件开发过程管理的重要因素之一。软件开发过程决定了产品的质量,提高软件质量的有效方法就是关注软件生命周期全过程的质量。本文对软件质量和软件质量管理过程
提出了一种针对监控视频序列的分段算法。算法计算输入视频帧与可更新背景帧的差异计算帧运动量,来实时更新背景,按当前帧与实时背景帧的差异进行聚类,然后按照每帧图像的类
目前许多应用在国防、空间和消费产品等领域的实时嵌入式系统往往既有功耗限制又有容错需求。容错技术与低功耗技术的融合是实时系统研究中值得注意的一种新趋势。本文首先介
全景图是基于图像绘制技术的主要内容。本文简述了全景图生成过程,对现有和经典图像配准和图像拼接方法根据其本质特征进行分类,并分析了各方法的优缺点,最后提出现存方法不