低功耗、低成本、可编程深度神经网络处理器设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:maming5201ww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度卷积神经网络算法近年来迅猛发展,现已被广泛应用于图像识别、医疗诊断等领域。深度卷积神经网络通常在CPU、GPU、ASIC、FPGA等平台实现,现有的深度卷积神经网络处理器主要被用于高端应用,如自动驾驶汽车,数据中心和智能手机,其注重产品性能。而对于物联网应用,更注重产品功耗与产品成本。此外可编程性对于处理器支持不同的深度卷积神经网络算法也尤为重要。本文提出一种专用于物联网应用的低功耗低成本可编程深度卷积神经网络处理器。本文首先对深度卷积神经网络处理器的国内外研究现状进行分析,介绍在不同平台实现深度卷积神经网络处理器的最新成果。根据处理器的应用需求不同,提出本文所设计的低功耗低成本可编程深度神经网络处理器。接下来本文对深度卷积神经网络算法的基本概念、硬件实现、并行性特征进行介绍。从理论层面验证卷积层、池化层、激活函数与全连接层硬件实现的可行性,同时从卷积核内并行性、输入通道并行性与输出通道并行性三个维度对本文深度卷积神经网络处理器并行计算设计进行分析,并提出衡量处理器性能的三种参数。然后在可编程深度神经网络处理器硬件设计部分,本文采用五种创新技术。在处理器低功耗设计部分,本文采用基于“簇”的“S”型读取策略与数据复用技术,达到对数据的最大化复用,减少存储区读取次数从而降低功耗;本文采用基于“图”累加的方式完成中间特征图累加操作,减少输入特征图像重复加载次数从而降低功耗;将近零值过滤与零值跳过技术结合,屏蔽零值数据的传输和计算从而降低功耗。在处理器低成本与可编程设计部分,本文采用可编程层处理计算架构,通过复用层处理计算架构完成深度卷积神经网络所有层操作,减少硬件资源降低设计成本,同时其可编程性也增强处理器的灵活性。并且处理器采用基于“行”型数据存储结构,加快数据读取速度,在数据读取与计算间取得平衡,提升处理器整体速度。最后本文使用Vivado 2017.1套件作为开发和仿真工具,给出仿真结果。并在Xilinx Virtex-7 FPGA VC707评估套件进行硬件验证。对基于FPGA的可编程深度卷积神经网络处理器进行准确率分析与性能分析,本文处理器获得了31.01GOPS/W,0.22GOPS/DSP的成绩,优于现有的几种深度神经网络处理器。同时针对本文所提出的可编程深度神经网络处理器进行总结,并对后期优化提出建议。
其他文献
神经递质受体在突触后膜高度聚集是突触结构重要特征。功能上,高度聚集的受体保证了高效而准确的突触传递。因此,对神经递质受体聚集的分子机制的研究是神经发育生物学中的重要
人的认识的发生是一个在主体、客体及其多级中介和环境所构成的参照系背景下产生出来的过程,这个参照系规定了人的认识的限度和人的认识的主体相对性。中国信息哲学提出的哲
佛教是一种重要的东方哲学文化,它的一些精神已经渗透进了当代的许多学科领域。在心理学领域,心理学在思想层面、理论层面和实践层面都能看到佛教的核心精神——Dukkha箴言(
李清照作品中的酒词是一朵艺术奇葩,词与酒的夙缘使其在精神世界里畅快地遨游。酒词印证的是她生命的痕迹,无论是感时伤怀、离别相思,还是孤寂悲苦、国恨家仇,流泻的都是她一
自"走出去"战略实施以来,中国企业对外直接投资对母公司经营绩效的影响一直是学术界关注的重要问题。利用2004-2006年对外直接投资的企业数据,本文从成本加成率的视角,对这一
在世纪交替的特殊历史时期,深化教育改革,大力推进素质教育作为根本性任务提到了广大教育工作者乃至全社会的面前.江泽民同志在党的十六大的报告就提出,要"坚持教育创新,深化
目的:比较乳腺浸润性微乳头状癌(Invasive Micropapillary Carcinoma,IMPC)与浸润性导管癌(Invasive Ductal Carcinoma,IDC)的生存及临床病理特征,探讨IMPC患者的预后影响因
随着世界经济的发展,各国间经济往来越来越频繁,国际投资成为了世界经济往来中重要的一个环节。与此同时,由其引发的投资争端也越来越多,为了推动世界经济的发展,必须要妥善
应用透射电镜研究国内外5083铝合金H116态退火组织中第二相的形态和微观结构,观察到三类不同形态和晶体结构的第二相。第一类为具有单斜结构或伪四方结构的板条状η-Al5(Mn,Cr
目的通过合成新的金刚烷甲酰肼衍生物,发现新型抗流感病毒药物。方法以金刚烷甲酸为原料,与甲醇反应得到金刚烷甲酸甲酯(1),再与水合肼经酰化反应合成金刚烷甲酰肼(2)。金刚