面向移动终端的嵌入式多核CPU核间通信机制评估

来源 :东南大学 | 被引量 : 0次 | 上传用户:shijunfengmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机与平板电脑等移动智能终端设备的迅猛发展,嵌入式多核技术得到了长足的进步。但是多核技术的应用也引入了处理器核间数据共享与同步等,这些处理器核间通信是通过Cache一致性协议实现,而维持一致性会产生一致性缺失事件,损耗多核处理器的性能,影响多核加速比的线性化。所以本文基于嵌入式多核处理器,研究与评估核间通信引起的一致性缺失事件在不同结构参数下对于嵌入式多核性能的影响。同时在Android交互式应用场景下,探索嵌入式多核的最优Cache微结构,评估结果为Cache的最优结构参数设计提供参考。  本文选用学界广泛使用的Gem5作为研究平台,Gem5是时钟周期精确型的仿真模型,其ARMDetailed模型可以模拟ARM Cortex-A9处理器,仿真数据真实可靠。本文首先详细分析了多核处理器核间通信的主要技术和Cache一致性的实现方式。通过Gem5的Cache Trace信息,提取了Gem5中引起Cache无效操作的主要请求事件,以及无效操作引起的一致性缺失事件和时间开销。然后在ARM Detailed模型上运行交互式应用测试集Bbench,评估不同处理器核心数目,L1 Data Cache的大小和Cache行大小结构参数下,一致性缺失对于嵌入式多核性能的影响,并给出基于Android交互式应用场景下不同核心数目的Cache最优微结构,以及核心数目对于最优Cache微结构的影响。  实验结果表明:一致性缺失及其延迟会损耗嵌入式多核处理器的性能。增大Cache大小和Cache行大小是降低DCache缺失数的有效方法,但由于假共享的影响,一致性缺失数目会随着Cache行大小的增大而逐渐增加。在2核、4核和8核情况下,当Cache微结构(Cache大小,Cache行大小)分别为(32KB、32B),(32KB、64B),(64KB、64B)时,交互式应用Bbench性能分别达到最优,此时一致性缺失延迟开销最低,分别为0.085s、0.132s、0.165s。最优DCache大小和Cache行大小均会随着核心数目增加而呈现逐渐增大的趋势。核心数的变化会影响最优Cache微结构的选择。
其他文献
碱基切除修复系统(BER)保证了哺乳动物中由氧化应激或电离辐射作用引起的最大量的DNA损伤的校正,并在维持基因组完整性方面发挥重要作用。在多步骤的BER过程中,涉及多种酶和蛋
电弧开断是开关电器设计和研制的关键。在直流低压电器中,常用的熄灭电弧的方式或是依靠电磁力把电弧拉长的自然式熄弧,或是借助狭缝灭弧室等来强制熄灭电弧。然而,随着电接触器件朝着多功能化、模块化、小型化、高密度等方向发展,这给传统制造技术带来了制造工艺和灭弧技术上的挑战。微机电系统(MEMS)技术凭借其超精密集成加工的特点,具有微型化、低成本、高可靠性和可大批量生产等优势,在微电接触器件领域大有可为。电
滇刺枣(Ziziphus mauritiana)是鼠李科(Rhamnaceae)枣属植物,与枣(Zjujuba)同为主要栽培果树,具有重要的食用和药用价值,主要分布于云南、四川等地,其根及树皮用于治疗烧烫伤
海洋沉积环境是一类典型而又复杂的海洋生境,蕴含着丰富且独特的海洋微生物资源。目前普遍认为99%以上的海洋微生物尚未实现纯培养,如何快速大量地从海洋沉积环境中获得微生物纯
学位
本文通过对荣华二采区10
期刊
量子信息学已经成为过去二十年兴起的最令人激动的科学进展之一。新兴的技术诸如安全量子密码、量子通信和量子计算机使得人们有可能处理原来根本无法完成的任务,因此不仅吸
波导缝隙阵列天线是单脉冲雷达广泛采用的天线形式之一,具有口径效率高、功率容量大、损耗小、结构简单及方向图易控制等优点。在现代电子战中,电磁环境愈加复杂,传统的波导缝隙
巴厘一揽子协定已达成2年,近期WTO在农产品方面的另一个重要成果是全面取消出口补贴。研究这些成果对各成员方产生的影响固然重要,但是如今在农产品多边贸易市场准入自由化仍
Sox家族基因编码一类含HMG DNA结合结构域的转录因子,它们通过影响细胞特化而广泛地参与到胚胎发育的各进程中。Sox19(19a)/sox31(19b)是筛选自斑马鱼中囊胚转换前后差异表达