低功耗、低成本、可编程深度神经网络处理器设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：maming5201ww

【摘要】

：

【作者】

：

王波

【出处】

：

电子科技大学

【发表日期】

：

2019年12期

【关键词】

：

深度卷积神经网络 FPGA 可编程性能效并行性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

深度卷积神经网络算法近年来迅猛发展,现已被广泛应用于图像识别、医疗诊断等领域。深度卷积神经网络通常在CPU、GPU、ASIC、FPGA等平台实现,现有的深度卷积神经网络处理器主要被用于高端应用,如自动驾驶汽车,数据中心和智能手机,其注重产品性能。而对于物联网应用,更注重产品功耗与产品成本。此外可编程性对于处理器支持不同的深度卷积神经网络算法也尤为重要。本文提出一种专用于物联网应用的低功耗低成本可编程深度卷积神经网络处理器。本文首先对深度卷积神经网络处理器的国内外研究现状进行分析,介绍在不同平台实现深度卷积神经网络处理器的最新成果。根据处理器的应用需求不同,提出本文所设计的低功耗低成本可编程深度神经网络处理器。接下来本文对深度卷积神经网络算法的基本概念、硬件实现、并行性特征进行介绍。从理论层面验证卷积层、池化层、激活函数与全连接层硬件实现的可行性,同时从卷积核内并行性、输入通道并行性与输出通道并行性三个维度对本文深度卷积神经网络处理器并行计算设计进行分析,并提出衡量处理器性能的三种参数。然后在可编程深度神经网络处理器硬件设计部分,本文采用五种创新技术。在处理器低功耗设计部分,本文采用基于“簇”的“S”型读取策略与数据复用技术,达到对数据的最大化复用,减少存储区读取次数从而降低功耗;本文采用基于“图”累加的方式完成中间特征图累加操作,减少输入特征图像重复加载次数从而降低功耗;将近零值过滤与零值跳过技术结合,屏蔽零值数据的传输和计算从而降低功耗。在处理器低成本与可编程设计部分,本文采用可编程层处理计算架构,通过复用层处理计算架构完成深度卷积神经网络所有层操作,减少硬件资源降低设计成本,同时其可编程性也增强处理器的灵活性。并且处理器采用基于“行”型数据存储结构,加快数据读取速度,在数据读取与计算间取得平衡,提升处理器整体速度。最后本文使用Vivado 2017.1套件作为开发和仿真工具,给出仿真结果。并在Xilinx Virtex-7 FPGA VC707评估套件进行硬件验证。对基于FPGA的可编程深度卷积神经网络处理器进行准确率分析与性能分析,本文处理器获得了31.01GOPS/W,0.22GOPS/DSP的成绩,优于现有的几种深度神经网络处理器。同时针对本文所提出的可编程深度神经网络处理器进行总结,并对后期优化提出建议。

其他文献

Dishevelled和MuSK以及PAK的相互作用调节乙酰胆碱受体的聚集

神经递质受体在突触后膜高度聚集是突触结构重要特征。功能上，高度聚集的受体保证了高效而准确的突触传递。因此，对神经递质受体聚集的分子机制的研究是神经发育生物学中的重要

学位

AgrinMuSK 受体酪氨酸激酶DishevelledPAK1突触神经肌肉接头

认识的主体相对性和真理的相对性

人的认识的发生是一个在主体、客体及其多级中介和环境所构成的参照系背景下产生出来的过程,这个参照系规定了人的认识的限度和人的认识的主体相对性。中国信息哲学提出的哲

期刊

认识论信息哲学真理相对性多元性不确定性量子力学“薛定谔猫”

佛教对当代心理学发展的影响

佛教是一种重要的东方哲学文化,它的一些精神已经渗透进了当代的许多学科领域。在心理学领域,心理学在思想层面、理论层面和实践层面都能看到佛教的核心精神——Dukkha箴言(

期刊

佛教四大箴言当代心理学影响

酒意“愁”情谁与共——李清照词中酒与愁情的绾结

李清照作品中的酒词是一朵艺术奇葩,词与酒的夙缘使其在精神世界里畅快地遨游。酒词印证的是她生命的痕迹,无论是感时伤怀、离别相思,还是孤寂悲苦、国恨家仇,流泻的都是她一

期刊

词酒愁情绾结

中国企业对外直接投资与母公司经营绩效——基于成本加成率的考察

自"走出去"战略实施以来,中国企业对外直接投资对母公司经营绩效的影响一直是学术界关注的重要问题。利用2004-2006年对外直接投资的企业数据,本文从成本加成率的视角,对这一

期刊

对外直接投资母公司经营绩效成本加成率

在新课标背景下对中学美术素质教育的思考

在世纪交替的特殊历史时期,深化教育改革,大力推进素质教育作为根本性任务提到了广大教育工作者乃至全社会的面前.江泽民同志在党的十六大的报告就提出,要"坚持教育创新,深化

期刊

美术素质教育推进素质教育深化教育改革中学美术教学美术教师新课标背景

乳腺浸润性微乳头状癌与浸润性导管癌患者的生存及临床病理特征分析

目的:比较乳腺浸润性微乳头状癌(Invasive Micropapillary Carcinoma,IMPC)与浸润性导管癌(Invasive Ductal Carcinoma,IDC)的生存及临床病理特征,探讨IMPC患者的预后影响因

学位

乳腺癌乳腺浸润性微乳头状癌乳腺浸润性导管癌免疫组织化学分子分型预后

“一带一路”区域内投资争端解决机制研究

随着世界经济的发展,各国间经济往来越来越频繁,国际投资成为了世界经济往来中重要的一个环节。与此同时,由其引发的投资争端也越来越多,为了推动世界经济的发展,必须要妥善

学位

“一带一路”双边投资协定区域贸易协定投资争端解决机制

5083铝合金组织中第二相的形态及微观结构

应用透射电镜研究国内外5083铝合金H116态退火组织中第二相的形态和微观结构,观察到三类不同形态和晶体结构的第二相。第一类为具有单斜结构或伪四方结构的板条状η-Al5（Mn,Cr

期刊

5083铝合金H116加工态透射电镜第二相形态结构

金刚烷甲酰肼衍生物的合成

目的通过合成新的金刚烷甲酰肼衍生物,发现新型抗流感病毒药物。方法以金刚烷甲酸为原料,与甲醇反应得到金刚烷甲酸甲酯(1),再与水合肼经酰化反应合成金刚烷甲酰肼(2)。金刚

期刊

金刚烷甲酸金刚烷甲酰肼衍生物抗流感病毒

低功耗、低成本、可编程深度神经网络处理器设计与实现

其他学术论文