【摘 要】
:
高性能计算(High Performance Computing,HPC)是指多个计算资源共同处理完成一个任务,从而达到提升执行速度的效果,它是并行计算的一种具体实现。当前主流高性能处理器,如NVIDIA GPU、Intel KNL、IBM Power系列处理器以及国产的申威和飞腾-迈创处理器等,虽然计算能力有所差距,但其架构的设计理念却有很多相通之处。它们都是按照分治的思想设计的,即把一个大的任
论文部分内容阅读
高性能计算(High Performance Computing,HPC)是指多个计算资源共同处理完成一个任务,从而达到提升执行速度的效果,它是并行计算的一种具体实现。当前主流高性能处理器,如NVIDIA GPU、Intel KNL、IBM Power系列处理器以及国产的申威和飞腾-迈创处理器等,虽然计算能力有所差距,但其架构的设计理念却有很多相通之处。它们都是按照分治的思想设计的,即把一个大的任务分解成众多的小任务,交给每一个子核去处理。其硬件设计上也是按照分层的逻辑去设计的。并行算法不是多个串行算法的简单联合,将并行的计算映射到并行的硬件需要科学的模型作为指导,即并行计算模型。算法和模型匹配,才会发挥出算法的优势,优化计算过程,反之甚至会增加算法的时间复杂度和空间复杂度。自并行计算提出以来,科学界一直在寻找一种普适的并行计算模型,现有的经典模型,如PRAM、LogP、C3、超立方、BSP模型、Multi-BSP模型等,都没有将调度因素结合到并行计算建模中。本文基于众核处理器硬件架构,提出了众核并行计算树形调度模型,该模型为通用模型,仅需更改模型的参数设置便可表达一种众核处理器。并且,本文将指令类型抽象为三种——计算、通信和调度,通过这三种指令便可表达任务在该模型中的执行过程。本文也侧重分析了调度类指令的含义,通过类汇编语言——PTX解释调度类指令的工作原理。本文描述了众核并行计算树形调度模型的逻辑模型,通过数学推理量化其数学模型,重点揭示了在任务执行过程中节点的调度机制,任务的划分机制,节点的通信机制和数据的传输机制,并通过任务下发、任务计算、任务反馈三个步骤建立了整个任务在该树形模型中的时间开销模型。本文将所提出的模型应用于当前典型的众核处理器架构,选择四种基础并行算法进行理论推导和实验验证:并行矩阵乘、并行前缀和、并行奇偶排序、并行FFT。通过分析对比,实验结果与理论推导相吻合,从而验证了本模型的有效性与通用性。
其他文献
非物质文化遗产的传承和保护一直是国家的重点工作,在目前的传承和保护工作中有许多诸如受众群体偏窄、传承收时空限制、大众关注度低和消费方式单一等问题。本文基于非遗保
本报讯 在开展同步小康驻村帮扶工作中,钟山区切实做到“四个强化”,围绕深入推进社会主义新农村建设和扶贫开发,全面改善农村生产生活条件,着力促进农业增效、农民增收、农村发
建筑业是国民经济的支柱产业,就业容量大,产业关联度高,全社会50%以上的固定资产投资要通过建筑业才能形成新的生产能力或使用价值,建筑业增加值约占国内生产总值的7%。建筑
近几年,随着互联网应用的发展,手机产业发展迅速,新的营销模式和新的技术产品层出不穷,创新营销模式带来的效果,有时不亚于企业在技术、产品或管理制度等方面的创新。在信息
中华民族数千年的辉煌历史离不开其高超的天下治理理论和实践支撑,天下治理蕴含着"天下无外"的世界思维、"化成天下"的教化使命和朝贡体系的秩序理念。天下思想为古代中国和
《普通高中生物学课程标准(2017年版)》“实施建议”中明确提出要强化和完备生物学实验教学,提高学生的生物学学科核心素养。在高中生物学教学中,探究性实验教学在培养学生实
以橘子、柚子、橙子皮为样品,考察了不同提取方法、提取溶剂种类、提取溶剂浓度及超声波温度、功率对样品紫外吸收光谱的影响。实验表明橘子皮中紫外吸收剂的含量高于橙子皮
目的探究胫腓骨骨折患者术后应用中药热奄包热敷神阙和吴茱萸粉调醋贴敷神阙穴后,患者腹胀、便秘的发生情况,以期研究中药热奄包热敷神阙和吴茱萸粉调醋贴敷神阙穴综合作用的
结合某地农村公路的实地调查,主要是通过水泥混凝土路面的使用实例,浅谈农村公路建设中存在的问题。分析公路线形设计、路面结构选择及公路养护问题中需考虑的因素及其建议。根
生物治疗是应用生物技术对各种疾病(如恶性肿瘤、先天性遗传病、传染性疾病、心血管疾病、风湿免疫性疾病等)进行治疗的1种新的治疗手段。生物治疗采用的生物技术主要包括抗