基于GCC编译器的激进蝴蝶优化方法研究

来源 :西华师范大学 | 被引量 : 0次 | 上传用户:anwencheng2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过编译优化分析发现,GCC编译器所采用的无效代码删除和自动向量化优化策略较为保守。当函数调用层数太多、复杂度太高时,无效代码删除优化存在一定的局限性;另外,循环自动向量化优化效率受不同数据结构布局方式的影响较大。为此,本文研究了编译器中无效代码删除和自动向量化的优化原理和实现方法,提出一种激进蝴蝶优化方法的解决方案,侧重解决分支路径依赖动态参数值及循环结构内自动向量化的优化问题。通过编译分析,研究GCC与AOCC、ICC和LLVM三款编译器的优化原理和不同优化模式,找出影响性能的主要因素;以GCC编译器为目标平台,对其通用优化能力和专用优化能力的缺陷进行分析总结,进而优化改进。本文的主要研究工作包含以下几个部分:(1)提出一种依赖数据流分析的区域级蝴蝶优化方法。该方法依托于使用GCC现有成熟的profiling反馈优化和常量传播技术,进行优化模式的识别、定位和程序关键信息的获取。再自动为程序生成两条或多条形状类似butterfly的分支代码:一条分支维持原有的保守设计,确保非常数参数条件下流程分支的正确性;其余分支进行对应条件下的激进冗余删除。使编译器在程序编译阶段,为相关优化提供可行的优化依据。(2)以butterfly为基础架构,对循环中结构体的内存布局方式进行优化转换。将GCC默认的结构体数组(Ao S)布局方式转换为数组结构体数组(Ao So A)布局方式。通过优化改进数据结构的布局方式,有效利用全宽度的向量寄存器,以提高向量化优化能力。(3)在SPEC CPU2017上对激进蝴蝶优化方法进行验证。实验结果表明通过区域级蝴蝶优化和数据结构布局优化能够产生预期的中间表示和指令。且测试用例的性能加速比得到有效提升,验证了本文所提方案的正确性和有效性。同时,在Intel和AMD两种架构上的实验结果也表明本文提出的激进蝴蝶优化方法具有一定的普适性。
其他文献
机器人的诞生让人们的生活更加智能化。其中,具有自主移动功能的移动机器人更是当下非常热门的科技成果。路径规划是移动机器人执行各项任务的前提,它决定了移动机器人是否能够在作业区域内安全、高效地执行任务,对移动机器人的性能具有十分重要的影响。现有国内外文献对移动机器人的发展动态和路径规划均作了大量的研究,但对移动机器人从某个起点出发、经过多个目标点并避开障碍物、最终返回起点的情形研究还较少,本文选取这类
随着人工智能技术的不断发展,传统的机械臂应用变得越来越智能化,其中的一个关键智能化提升就是使机械臂获得在非结构化空间环境中对某种目标物品按某种物理属性进行快速分拣的能力。本文采用深度强化学习算法DDPG(Deep Deterministic Policy Gradient)代替在机械臂控制中的逆运动学解算方法,通过数据驱动的训练过程控制机械臂到达目标位置,从而抓取目标物体,达到分拣目标物品的目的。
智能建筑是“以建筑物为平台,兼备信息设施系统、信息化应用系统、建筑设备管理系统、公共安全系统等,集结构、系统、服务、管理及其优化组合为一体,向人们提供安全、高效、便捷、节能、环保、健康的建筑环境”。智能建筑的环境监测系统是智能建筑的重要子系统,它对建筑体内外环境提供全天候监测,为环境异常预测、节能降耗、安全管控、便捷生活等提供数据支持,有效保障建筑体及内部人群的生命财产安全,一直是现代建筑领域、信
近些年,随着通讯技术的快速发展,互联网上的内容越来越丰富,互联网已成为人们获取信息的主要途径。随着信息的指数级增长,对信息进行分类整理,减少信息检索的时间成本,提高信息资源的利用效率就显得越来越重要。文本是信息传递的重要载体,传统的文本分类模型需要人工进行特征工程,效率低下。所使用的特征提取方式具有高维度、高稀疏性的缺点。目前,基于深度学习的RNN(Rerrent Neural Network)和
脑肿瘤是威胁人类生命安全的常见肿瘤之一。传统的脑肿瘤诊断方式是医生根据病人身体的不良症状以及眼底的并发症进行判断。随着医学技术的发展,现阶段对脑肿瘤的诊断方式变为了由医生根据病人的脑部MRI图像进行判断,但这种方式随着医生日常增多的工作量以及各个医生临床经验的不同,误诊、漏诊的情况在长期的临床诊断中时有发生。计算机辅助诊断系统(CAD)可以准确识别图像,协助医生进行日常阅片工作,缓解工作压力,提高
随着人脸识别技术日渐成熟,人脸识别已广泛应用到访问控制、人脸支付和设备解锁等场景中。因此,人脸识别系统的安全性引起了越来越多的关注。人脸识别系统主要基于图像特征的提取与匹配,完成身份认证。这种认证方式容易受到欺骗攻击,如在认证系统前呈现伪造的人脸照片、视频或3D面具等,导致虚假认证。人脸活体检测通过分析摄像机捕捉的人脸信息,进而判断认证者是否为活体用户,是人脸认证系统抵御欺骗攻击的重要技术手段。目
眼底视网膜血管的不同形态(如直径、长度、分支等)具有十分重要的临床意义,可用于监测和分析各种心脑血管疾病和眼科疾病。自动分割眼底图像中的视网膜血管,可以有效帮助医生对各种心脑血管疾病和眼科疾病病人做出更全面的诊断和进一步的治疗,增加治愈的可能性。在研究过程中发现由于采集设备、拍摄角度和光照等的差异对眼底图像获取的影响,想要对眼底图像的视网膜血管进行精准分割就显得十分困难。而且现有模型存在分割过程中
汽配件喷涂是汽车零配件生产流程中重要的环节,对汽配件颜色喷涂生产问题进行优化,有助于企业进一步降低生产成本,而目前尚无文献对该类问题提出针对性的数学模型和解法,故针对汽配件喷涂生产问题提出高效的求解方法对实际生产具有理论指导意义。首先,将实际单轮汽配件喷涂生产问题转化为数学问题,考虑到每一个汽配件必须喷涂且只喷涂一次,具有旅行商问题(TSP)的基本特征,故采用借鉴TSP问题建模的方法对单轮汽配件喷
在推荐系统中,高维稀疏矩阵常用来描述用户和项目实体间的二元关系,隐特征分析方法能够对高维稀疏矩阵中缺失值进行估计,通过缺失预测达到对用户进行个性化推荐效果。随机梯度下降法是求解隐特征分析模型的有效策略,然而基于随机梯度下降算法的隐特征分析模型很大程度上依赖于超参数学习率的选择。粒子群优化算法(PSO)因其收敛快速和实现简单的优点已经被成功用于隐特征分析模型的超参数学习率的自适应调谐,但是由于标准P
得益于深度学习,目标检测研究取得了巨大的突破,但是在实际生活场景的应用中,并未达到人类实现高效管理最理想的效果。比如交通参与者是道路交通活动的基础,随意运行的车辆和行人容易打破良好的交通秩序,对其进行检测有助于优化城市管理,建设新型智慧城市。比如,绝缘子是架空输电线路的绝缘控件,需要承受超高的机械强度,自爆后需要及时更换,否则将会难以管控线路的输电调度。人工智能赋能行业发展,目标检测作为其基础课题