面向神经网络处理器的编程框架研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：simetl1235

【摘要】

：

随着智能时代的到来，深度学习在图像识别、网络搜索、在线导航等领域发挥着越来越重要的作用。面向深度学习的专用神经网络处理器(简称IPU)设计了专有的运算部件，因此在处理图

【作者】

：

赵浩钧

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2017年期

【关键词】

：

神经网络处理器编程框架 MXNet技术深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着智能时代的到来，深度学习在图像识别、网络搜索、在线导航等领域发挥着越来越重要的作用。面向深度学习的专用神经网络处理器(简称IPU)设计了专有的运算部件，因此在处理图像识别等关键智能应用上可达CPU百倍的能效。但是，编程困难仍然是神经网络处理器走向推广应用的壁垒。　　本文为专用的神经网络处理器实现了一个高效、易用的编程框架，主要工作包括以下几个方面:　　1.调研了业界开展的深度学习硬件加速器研究，并对比了开源社区中被广泛使用的深度学习编程框架，以及这些编程框架常用的优化方法。　　2.实现了面向神经网络处理器的编程框架。以MXNet作为研究基础，完成了神经网络处理器设备支持、引擎调度、内存管理、网络模型基本操作的扩展。　　3.建立了神经网络处理器执行时间的评估模型。依据对该性能模型的分析，提出了“层融合”优化和访存优化。“层融合”优化减少了处理器的启动次数和多个操作中间结果的载入载出。访存优化实现了在多个Batch间共享网络模型参数，减少数据拷贝，并由编程框架确定了最佳的BatchSize，使得预测所有图片需要的Batch数量减少，总的硬件启动开销降低。　　在寒武纪神经网络处理器平台上对本文的编程框架进行功能验证和性能评估，实现了AlexNet、CaffeNet、VGG、GoogleNet、ResNet等典型的卷积神经网络模型。对比CPU上的Top1和Top5准确率，证实了本文实现的编程框架可以正确的运行在神经网络处理器上。并且经过“层融合”优化和访存优化后神经网络在IPU上的执行时间相对于优化前有10％到40％的加速比提升，有效提升了神经网络处理器的执行效率，充分发挥了IPU的性能。

其他文献

面向基因组数据分析的大数据编程框架

近年来，二代基因测序技术的迅速发展使得测序平台产生的数据量大幅增长。以GATK、BWA等工具组成的二代测序数据分析流程在业内得到了广泛的使用。现有的数据处理工具和方法受

学位

基因组分析Spark技术大数据编程框架

基于Java平台的公钥基础结构

利用开放式网络开展商务和政务活动对网络的安全性提出了更高的要求，最为重要的安全性要求包括：参与方的身份认证，会话的机密性，会话的完整性和抗抵赖性。常规的加密技术很难满足

学位

公钥基础结构数字证书用户认证与授权控制证书路径的建立与验证Java平台

存储区域网管理控制系统的研究及设计

随着Intranet／Internet的广泛应用，信息技术日益高速的发展，用户对数据存储性能的要求越来越高。而传统的分散式存储结构由于自身的局限性，很难从根本上解决实际面临的问题。

学位

存储区域网SAN存储管理控制系统FC-AL(光纤通道仲裁环网)磁盘阵列

PACS系统中医学图像处理算法与存储结构的研究

医学图像相对与其它类型的图像有其信息量大,处理涉及专业知识等特点,处理的难度很大.在分割算法方面,研究中改进了医学图像的二值化算法,给出了数种重要几何特征参量,综合地

学位

标准医学图像通讯协议图像处理边界分割区域分割模式识别存储体系并行处理

基于Java/J2EE的WebGIS的模型研究

GIS技术一直是计算机应用技术领域的热门研究之一,随着Internet技术的普及和深入,GIS也由传统的集中式向着C/S系统、WebGIS系统发展,WebGIS技术也成了GIS技术的前沿研究.WebG

学位

地理信息系统JavaJ2EEApplet矢量模型

基于agent的信息融合与信息过滤机制的研究与实现

随着数字电视的逐步普及，面向数字电视的智能化信息服务系统逐渐成为研究的热点。既提供个性化又提供大众化的服务是这种系统的目标，该系统涉及的许多相关领域值得深入研究。

学位

信息过滤信息融合信念修正不对称距离agent

基于Web服务的企业应用集成方案的研究

该文基于Web服务的集成方案中,依靠Web服务,通过松散的应用集成,企业能够实时地访问不同部门、不同应用、不同平台和不同系统的信息.Web服务系列技术是架构在XML技术的基础上

学位

网络服务企业应用集成可扩展标记语言简单对象访问协议网络服务描述语言XML技术Web服务客户端

龙芯3号处理器性能分析与优化

处理器性能分析对于性能瓶颈的定位，指导下一代处理器的设计，具有十分重要的意义。随着微处理器的结构日趋复杂以及目标工作负载的不断变化，性能分析的难度也不断增大。如何使用

学位

处理器性能分析基准测试程序程序行为分析

车辆导航定位和监控系统的研究与实现

车辆导航定位系统是智能交通的最基本的单元,而监控及指挥系统是管理者进行管理的基本工具.该论文首先介绍了车辆导航系统的基本构成及相关联的地理信息系统(简称GIS)的基本

学位

智能交通车辆导航定位系统地图匹配确定转折点算法角度累加算法

基于内容检索的多媒体数据库系统研究

多媒体数据库技术是一门新的数据库技术。按内容检索是目前多媒体数据库系统迫切需要的查询手段，也是急待研究的课题。本文围绕基于内容检索的多媒体数据库系统中的关键问题进

学位

多媒体数据库内容检索媒体对象体系结构特征提取区域特征面向对象的视频处理技术信息建模索引结构

面向神经网络处理器的编程框架研究

其他学术论文