【摘 要】
:
近年来,卷积神经网络(Convolutional Neural Networks,CNN)在许多计算机视觉领域都得到了广泛应用。但是目前卷积神经网络的结构越来越复杂,这大大增加了硬件单元的计算难度,
论文部分内容阅读
近年来,卷积神经网络(Convolutional Neural Networks,CNN)在许多计算机视觉领域都得到了广泛应用。但是目前卷积神经网络的结构越来越复杂,这大大增加了硬件单元的计算难度,阻碍了网络计算性能的进一步提高。因此,近年来有许多的研究者聚焦于神经网络的加速研究。由于FPGA具有可重构性、快速的响应时间、能更好的切合高层次综合(HLS)工具等诸多优点,有许多研究者提出了基于FPGA的CNN加速器设计方法,来提升卷积神经网络的计算性能。近年来许多研究者提出了低数据位宽卷积神经网络的实现方法,结果表明卷积神经网络的位宽能低于32-bit,且每层的位宽需求不同。同时也有相当多的研究者提出了稀疏卷积神经网络的实现方法,而稀疏卷积神经网络中存在许多无效的0值,消除这些无效0值有可能实现网络计算性能的提高。然而目前大部分基于FPGA的CNN加速器设计仅仅使用一个单一位宽的卷积计算单元(Convolutional Processor,CP),来重复计算卷积神经网络中的所有层,并且没有考虑稀疏卷积神经网络的稀疏化特性。这样的传统方法导致FPGA片上的资源利用率非常低,使得卷积神经网络很难有更进一步的性能提升。为了解决这些问题,本文提出了低数据位宽稀疏卷积神经网络加速器的方案设计。我们针对卷积神经网络的低位宽数据进行了DSP计算操作的优化,提高了DSP的计算利用率。我们接着提出了针对低数据位宽卷积神经网络的多卷积计算处理单元的结构(Multi-CPs),使得每一个卷积计算处理单元(CP)有不同位宽,让他们对不同位宽的卷积层进行流水计算。在低数据位宽卷积神经网络加速器设计基础上,我们接着提出了针对稀疏卷积神经网络的加速器优化设计方案,能将稀疏卷积神经网络中的无效0值去除,进一步提高加速器性能。最后,我们提出了硬件资源分配的优化方法,以得到最佳的加速器设计方案,并为每个计算处理单元(CP)分配了最佳的DSP资源,通过对低数据位宽与稀疏化特点的设计结合,我们得到了最后的加速器整体设计方案。我们的方法特别能提高那些具有复杂结构的神经网络的计算性能。在Xilinx型号为Virtex-7 485T的FPGA上我们对典型的CNN网络AlexNet与VGG网络进行了综合测试,我们的方法相比传统的方法具有5.68倍到6.67倍的性能提升,平均性能提升倍数达到6.17倍,本方法设计具有非常高的研究价值和应用价值。
其他文献
信息化时代的战争离不开及时、准确、可靠的雷达对抗情报,雷达电子战中的雷达对抗是获取雷达对抗情报的主要手段。但是,随着电磁环境的日益复杂,雷达辐射源信号的密度指数激增,这就对信号处理算法在有效性、可靠性和时效性等方面提出了更高的要求。传统雷达信号分选,主要是载波频率(Radio Frequency,RF),脉冲宽度(Pulse Width,PW),脉冲幅度(Pulse Amplitude,PA),到
不同于以往的建议研究主要着重于建议采纳,本研究将考虑从建议寻求和建议提出的角度入手,总共进行了三个实验,探讨建议寻求者的注视方向对建议者建议提出意愿的影响。实验一(N=107)为单因素实验设计,自变量分为正视和斜视两个水平,因变量为建议提出意愿,以探讨建议寻求者的注视方向对建议者提出建议的意愿的主效应,以及建议者感知到的角色期待是否中介了注视方向对建议提出意愿的影响;实验二(N=315)为2*2的
个体在社会比较的过程中,处于弱势地位的个体认识到自身的不足并产生诸如不满、愤怒等负性情绪,这样的心理状态被称为“相对剥夺感”。相对剥夺感可能会对个体的心理健康、行为决策造成不良影响,出现酗酒、赌博等问题行为。跨期决策则是个体在日常生活中常常遇到的一种决策类型,个体需要在短期收益和长期收益中做出权衡。为了探究相对剥夺感是否会造成人们在跨期决策中的“短视”行为以及自我控制在其中的作用机制,本文采用问卷
人体动作识别技术是通过计算机对包含有人体动作的视频进行分析与处理,然后对视频中人体动作进行识别的一个过程,其被广泛的应用于不同的领域之中,例如智能视频监控、人机交互、体育运动分析、基于内容的视频检索等,已经成为了计算机视觉、图像处理领域的热门课题之一。当前,虽然存在着大量的动作识别方法,但是由于人体运动的交互性、背景的复杂性、光照的变化性以及相机抖动等因素的影响,导致进行人体动作识别时存在的处理时
目的:昆虫发育规律对于最短死后间隔时间(PMImin)的推断至关重要。肥躯金蝇Chrysomyapinguis(Walker)(Diptera:Calliphoridae)是具有重要法医学意义的亚洲种类,通常是春秋时节或高海拔地区最早抵达尸体并产卵的嗜尸性丽蝇。目前国际上尚无该物种发育数据的报道。丽蝇蛹集金小蜂Nasonia vitripennis(Walker)(Hymenoptera:Pter
本论文研究一个单期多产品的库存调拨问题。我们假设产品可以在不同的零售店之间进行调拨。由于产品的需求是随机不确定的,有效的配置各产品的库存和产品调拨可以让零售店更
火电厂脱硫废水由烟气的石灰石-石膏湿法脱硫产生,主要包括悬浮物、重金属、盐类等污染物。从脱硫废水处理现状来看,传统的物化处理不能满足废水回用,需要进行脱硫废水的深度
现如今无线通信技术以及大规模集成电路技术发展快速,无论是在军事、天文探测,还是即将5G通信时代,都要求无线通信射频系统不断朝着集成化,多业务,低成本以及小型化的趋势演进发展。另外一方面,各种各样的电磁波信号导致频谱的资源紧缺,各类通信互相之间的电磁干扰日益严重。滤波器作为无线通信射频前端中重要的元件,主要用于将通信频段从频谱中分离出来。设计具有小尺寸、多业务集成和强抗电磁干扰滤波器已经成为当今的热
冠心病是危害人类健康的主要疾病,目前最主要的治疗方式是基于血管支架的介入治疗,但支架植入后的再狭窄是支架介入治疗过程中亟待解决的重要问题。内皮细胞的损伤和血管平滑肌细胞增殖是冠心病介入性治疗后再狭窄的主要病理过程。一定浓度的Cu离子能够促进内皮细胞生长,抑制平滑肌细胞的增殖,并且铜具有良好的抗菌性能,可有效避免植入器械的细菌感染问题。因此,将具有生物惰性的Ti和生物功能性的Cu两种金属相结合,制备
循环肿瘤细胞(CTC)检测技术分为体外检测和体内检测。体外检测方法通常会受到血液量的限制,而体内检测的载体材料,常常采用金属丝、化学纤维丝。由于丝、线承载力的限制,通常直径(>500μm)远远大于被捕获的目标细胞CTC(10-50μm),对于捕获CTC,载体丝线表现出了较大的空间位阻,严重影响捕获效率和检测灵敏度。据此,在本研究中,我们选择天然大分子-蚕丝丝素蛋白纤维作为载体,它具有柔软,较