基于QEMU的可配置专用处理器核功能仿真模型

来源 :南京大学 | 被引量 : 0次 | 上传用户:mimi107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着片上系统(System On Chip,SoC)产业的不断发展,软件模拟器在体系架构设计、软硬件协同设计、验证测试等方面发挥的作用越来越大。在可配置专用处理器(RASP)核的开发设计过程中,完成了基于Matlab的算法计算模型以及基于SystemC的周期精确模型,虽然它们在算法设计和体系结构设计以及验证方面有着不可忽视的作用,但它们都不适合进行带操作系统的全系统仿真。  为此,本文使用在模拟速度上优势明显的QEMU模拟器作为开发平台,利用其提供QOM(QEMU Object Model)虚拟设备模型,对RASP核进行功能上的仿真模拟。通过对RASP核的功能和体系架构分析,本文将RASP核的功能仿真模型依据功能划分为对外接口层、控制层以及算法实现层三个层次。其中,对外接口层负责RASP核寄存器组的模拟和SRAM的模拟,控制层负责RASP核的主控制器的模拟,算法实现层负责DMA模块、重构控制器、可重构运算阵列的模拟。本文按照以上三个层次的顺序,在对外接口层,实现了寄存器组模块和内部存储区模块;在算法控制层,设计并实现了运算任务队列,并利用运算任务队列实现了对内部算法的调度以及主模式、从模式和调试模式等运行模式;在算法实现层,设计了适用每个算法运算单元的通用分步运行流程,并在模拟RASP核内部运算IP的基础数学计算函数的基础上,以互相关算法和复数FIR算法为例介绍了算法运算单元的实现方法。最后,通过使用QEMU模拟器的QTests,本文设计并实现了简单易用的通用test case测试模板,并利用该模板对RASP核功能仿真模型进行了功能和性能上验证。  本文基于QEMU设计并实现了一个高性能的RASP核功能仿真模型,对比基于SystemC的周期精确模型,本模型在忽略内部细节的基础上实现了相同的功能与算法运算精度,并在运行速度上有着明显的提升。不同算法、不同数据量的情况下,指令运行的速度提升不同,小点数算法指令的执行速度得到了约3~6倍左右的提升,大点数算法指令的执行速度得到了约10~30倍左右的提升。
其他文献
哺乳动物卵母细胞与体细胞和雄性生殖细胞有显著的不同,它们会经历独特的减数分裂第一次分裂前期阻滞过程。出生后,卵母细胞进入减数第一次分裂前期并阻滞在终变期。阻滞过程中
利用青藏高原东北侧区域平均降水量资料(1958~1997年)和同期NCEP/NCAR再分析500 hPa网格资料(2.5°x 2.5°),分析发现:(1)高原东北侧汛期降水份额最大的7、8、9月3个月近40年降水明显减少,过去明显存在的准3年周期振荡80年代以来
航天遥感器的设计和运维是一个涉及光、机、电、物理等多学科的复杂的系统工程。航天遥感器的特殊使用环境,决定了它的研制、使用是一个高成本、高风险的过程。而结合计算机
摘要:作为高中的三大主要科目之一,英语教学长期处于重要的位置。随着高考改革的深入进行,浙江省英语高考改革成为社会的热点问题之一。本文主要探索浙江省高考英语改革的主要原因及其新的高考改革下英语教学的变化,并提出一些针对性的措施与建议。  关键词:高考;英语改革;题型创新  中图分类号:G632.0 文献标识码:A 文章编号:1992-7711(2016)04-0108  2014年,浙江省根据国务院
非物质文化遗产是人类“行走的灵魂”,刻录着民族文化的符号和密码,蕴含着民族独特而丰富的想象力、文明意识和民族精神,对于人类生存与延续具有重大的意义和价值.本文通过对
非遗是与群众生活密切相关及世代相承的高价值文化资源,作为民族文明与智慧的结晶,加大非遗保护力度,对维系国家统一,实现经济社会可持续发展意义重大.本文主要对非遗保护传
自从石墨烯2004年被发现以来,短短几年间,石墨烯的研究得到了迅速发展。石墨烯因其优异特性使得成为研究的热点,成为最有潜力的碳基纳米材料之一。然而石墨烯尚有许多特性有待人
微悬臂梁结构是MEMS器件结构中最基础、最简单的结构。一般的微悬臂梁式传感器主要有两种工作模式:静态形变模式和动态振动模式。静态形变模式是利用悬臂梁结构极高的力学灵敏
本论文在综合分析国内外医疗废物处置技术及其应用管理模式的基础上,结合中国医疗废物管理和处置现状,提出了中国医疗废物处置技术选择及应用模式,并对如何优化现行医疗废物处置
CRISPR/Cas9介导的基因组编辑技术已在多种植物中得到广泛应用,但常规的基因组编辑技术使得CRISPR/Cas9表达载体整合在植物基因组中,从而延长基因的表达时间并增强脱靶效应。针