【摘 要】
:
基本线性代数子程序(BLAS)是一系列基本线性代数运算函数的接口标准,早已被广泛应用在科学计算和工业界的各个领域中,并对现代科学领域和工业发展起到了至关重要的作用。其应用场景针对大型输入(大型矩阵、向量操作)往往有较好的性能表现;然而在问题规模较小,而问题数量较大的场景下会由于资源利用不充分导致性能表现较差。因此近年来提出了批量BLAS(Batch BLAS)的概念和初步实现,以应对这种新兴趋势带
论文部分内容阅读
基本线性代数子程序(BLAS)是一系列基本线性代数运算函数的接口标准,早已被广泛应用在科学计算和工业界的各个领域中,并对现代科学领域和工业发展起到了至关重要的作用。其应用场景针对大型输入(大型矩阵、向量操作)往往有较好的性能表现;然而在问题规模较小,而问题数量较大的场景下会由于资源利用不充分导致性能表现较差。因此近年来提出了批量BLAS(Batch BLAS)的概念和初步实现,以应对这种新兴趋势带来的挑战。它通过将多个子问题同时并行批量处理,解决以往经典BLAS中对于这种场景表现较差的窘境。对于批量矩阵相乘而言,目前基于GPU的BLAS库(Cu BLAS、Roc BLAS)只支持固定尺寸的问题输入,而不支持可变尺寸矩阵计算,极大的限制了其应用场景。本文旨在设计并实现一个面向高性能计算的GPU批量可变尺寸矩阵乘法计算框架,从而解决在高性能场景下已有的计算库性能表现不佳的问题。研究内容包括批量可变尺寸矩阵乘法场景分析研究与MAGMA vbatched例程优化、细粒度批量可变尺寸矩阵乘法内核函数设计与实现、批量可变尺寸矩阵乘法计算框架设计与实现和HPCC DGEMM的应用与优化这四个方面。在批量可变尺寸矩阵乘法场景分析研究与MAGMA vbatched例程优化中,本文研究分析了批量可变尺寸矩阵乘法的具体应用场景的输入情况,同时分析研究了目前业界在GPU中最优的MAGMA实现中的优势与存在的问题,并针对这些问题进行优化。在细粒度批量可变尺寸矩阵乘法内核函数的设计与实现中,本文针对应用场景对问题输入进行了细粒度的设计与划分,并结合GPU硬件架构从内存层级入手来实现高效并行的GPU内核函数。在批量可变尺寸矩阵乘法计算框架的设计与实现中,本文提出细粒度内核函数优化层级、批次序优化层级、极端数据输入调整层级来提高计算框架的计算表现。在HPCC DGEMM的应用与优化部分中,本文对该测试进行基于任务的划分和细粒度切割划分来优化,以提高目前高性能计算集群中多GPU节点的系统表现。本文针对目前批量矩阵乘法进行了改进和优化,提高并扩展了BLAS库对于批量操作的支持度和适用性,以望解决目前在高性能计算、机器学习、科学计算等领域出现的新挑战。
其他文献
为了探讨不同骨料级配、水胶比、减水剂用量和外掺砂率对透水混凝土的强度与渗透性的影响,采用控制变量法进行透水混凝土20组配合比设计,并分别对抗压强度(fcc)、抗折强度(ff)、透水系数(k)以及有效孔隙率(ρe)进行测试。结果表明:1)骨料级配、水胶比、减水剂、外掺砂砂率均对透水混凝土性能产生显著影响,当骨料为单一粒径4.75 mm~9.5 mm的粗骨料、水胶比为0.27、减水剂用量为0.3%时,
在海绵城市建设过程中,透水混凝土施工作为最基础的一项,其性能评价对整体工程质量把控起到重要的作用。目前,透水混凝土的性能评价大部分引用了普通混凝土的试验检测方法,但是由于透水混凝土与普通混凝土性能上存在较大差异,采用普通混凝土试验检测方法难以准确地对透水混凝土质量进行评价,且透水混凝土与普通混凝土在施工工艺上也存在较大差异,故而在进行抗压强度、透水系数等性能试验检测时,还需注意该差异性对检测结果产
由于水体污染而导致的饮用水中毒,已经成为在全球范围内居民健康的巨大威胁,每年由于饮用不洁净的水致使数百万人患病死亡。目前主要的水体污染包含重金属离子、有机污染物和微生物污染等,其中重金属离子、抗生素由于生物毒性大,容易在体内累积、污染渠道多,是主要的水体污染。研发绿色高效的重金属离子及抗生素去除方法,是近年来水污染处理的重要研究方向。新型纳米材料具有常规材料无法比拟的吸附或降解污染物的能力,给水处
长期以来,我国生猪价格波动剧烈且频繁,给养殖户和产业企业生产经营带来极大的不确定性,利润难以稳定。2021年1月8日,我国首个活体交割期货品种——生猪期货合约在大连商品交易所上市交易,给生猪市场注入新活力。价格发现功能是期货市场最为基本的作用,如果生猪期货市场运行平稳发挥有效,将会对生猪养殖和屠宰企业未来的生产与经营活动有指导作用,有助于生猪产业长远稳健发展。因此,本文主要研究我国生猪期货与现货市
以互联网技术为基础架构的网络空间已深深地嵌入到人类生产生活的各个方面,极大地影响了人类的生存方式和社会发展进程。然而,事物的发展往往呈现出两面性,互联网技术大大提高社会生产力、改善人类生活质量的同时,也带来了诸如数字鸿沟、网络犯罪、网络战争、侵犯知识产权和个人隐私权等多方面问题,有些问题甚至威胁到了国家主权和国家安全。习近平总书记指出,“当今世界,围绕网络空间发展主导权、制网权的争夺日趋激烈,各大
在5G和B5G通信技术快速发展的今天,用户对无线通信网提出了大容量和高可靠的要求,但传统蜂窝通信网在应急通信场景下难以有效保障用户的可靠接入。而无人机负载和续航等能力的提升为其搭载通信设备充当移动空中基站提供了可能性,因此结合无人机部署灵活快速的特点,无人机通信将成为灾区和流量热点地区提升通信保障能力的有效解决方案。尽管将无人机集群应用于应急通信具有重大现实意义,但无人机集群频繁的拓扑变换和复杂的
随着科学技术的发展,移动通信数据的迅速增加以及各种新业务和场景的持续出现,5G成为了国内外专家和学者重点研究的对象。在毫米波频段,由于存在丰富的频带资源,实现较大的带宽与较低的时延,能够满足在5G通信中的大信道容量和低延迟传输等需求,因此无线通信的工作频率逐渐地被扩展到毫米波频段。但同时也存在相对较大的路径损耗,导致传输距离大大减小,因此对毫米波天线的设计有着比较严格的要求。并且为了满足抑制栅瓣的
随着5G的商用以及短视频时代的到来,流量需求呈爆发式增长,频谱短缺、链路拥塞、电磁干扰等等问题日益严峻,无线通信网承受了巨大的压力。与此同时,网络中存在着大量的同质化内容被反复传输,造成了极大的资源浪费。因此,减少无线通信网络同质内容的传输并提升用户访问获取资源的速率成为了当下亟须解决的问题。移动边缘缓存(Mobile Edge Caching,MEC)技术能够显著降低无线通信系统回程拥塞程度,极
我国在2000年前后步入老龄化社会,之后成为世界上老龄化速度最快的国家之一,第七次人口普查数据显示,全国有12个省和149个城市进入深度老龄化。在此背景下,我国居民部门债务规模快速扩张时期恰好是我国老龄化加速期。2020年我国居民杠杆率达62.19%,在新兴经济体中居于首位,已经成为威胁我国金融稳定的潜在风险点。从理论上看,人口老龄化与居民债务风险确实存在一定的联系,但人口老龄化和居民债务风险的实
粮食安全是国家战略,其关键在于提高农民的种粮收入,调动农民的种粮积极性。我国于2016年开始试点“保险+期货”模式,试点所涉及的农产品种类不断丰富,规模不断扩大,但现货价格与期货价格之间的差额使农户仍面临基差风险,且农户规模小、分散的特点使其难以获得稳定的售粮渠道。为解决这些问题,中央一号文件于2018年首次提出探索“订单+保险+期货”试点,在传统模式基础上引入“订单农业”,即农户向保险公司购买保