基于4 × 4卷积核的异步卷积加速算法研究

来源 :软件工程与应用 | 被引量 : 0次 | 上传用户:wlshhgz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于基于软件端卷积神经网络的卷积运算难以满足现在的卷积神经网络对运算性能与功耗的要求,为了克服困难,本文设计了一种基于4 × 4卷积核的异步卷积加速算法来对卷积神经网络进行加速。采用AddTree的形式来实现kernel矩阵和pic矩阵的乘加运算,1个Add Tree计算单元是1个4 × 4的卷积核与相同大小的图片矩阵的数据做乘加运算得到一个特征值,采用多个Add Tree的并行计算方式可以大幅度提升卷积计算速率。实验结果表明,该加速算法还有不受时钟频率限制的优点,可以工作在任何时钟频
其他文献
2月12日上午,由省人力资源社会保障厅、广州市农民工工作领导小组共同举办的2011年"南粤春暖"就业服务月广州市百场招聘会启动仪式暨外来务工人员维权宣传活动在广州市隆重举行
本文在对我国农产品追溯系统中不同参与主体的需求差异分析的基础上,引用编码技术和HTML5移动端自适应技术等技术完善信息录入过程,提供APP,网站等多种查询方式可供用户灵活
蛋白质复合物通过相互作用蛋白质形成,表现出多样的生物功能。使用计算方法从生物网络中预测蛋白质复合物不仅对于理解生物活动的机制和疾病的发病机理具有重要意义,而且可以
2014年1月~2016年12月本社区选取了老年COPD患者60例实施了康复护理,比较干预前后患者肺功能、运动能力、心理能力及生活能力变化情况。干预后患者VCmax、FEV1、PEF、FEV1/FV
将2015年7月~2016年7月在我院老年精神科治疗的224例老年痴呆患者随机分为两组,对照组采用常规护理方法,观察组采用个性化护理方法,比较两组患者的症状改善情况及日常生活能
本体技术能更好地以一种结构化的、可计算和可共享的形式表示各种术语、概念所隐含的知识,基于本体的知识表示方法已经在许多领域得到广泛的应用。针对目前工程信息处理中缺
随着我国经济社会的不断发展以及科技技术的逐渐发达,地震等自然现象也被人们不断的探究与钻研。从而得知地震属性可以作用在底层、断层以及裂缝岩性相合等等方面,所以我们也
随着生活条件的改善,当今社会的消费观念也发生了很大变化,尤其是大学生年轻有朝气,更喜欢新鲜时尚的东西。但从有关调查结果看,大学生仍普遍认为全社会提倡的“勤俭节约”是一种
开发高性能并行可视化服务器可充分发挥高性能计算机的资源优势,实现基于高性能计算机的高效并行可视化服务,克服传统后处理模式科学可视化存在的效率低等问题。本文介绍了高