面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法

来源 :计算机辅助设计与图形学学报 | 被引量 : 5次 | 上传用户:never03330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对卷积神经网络FPGA加速器的资源分配与频率设置欠佳导致吞吐量受限的问题,提出一种面向吞吐量优化的自动化设计方法.首先将加速器的设计分为并行策略和频率设计,提出总体设计流程;然后将设计空间探索建模为线段分割问题,采用遗传算法及贪心算法求解;最后根据求解出的并行策略完成加速器的结构设计,根据求解出的预期运行频率对加速器的布局布线优化,使实际频率可以达到预期.对AlexNet及VGG-16模型在目标器件AlteraDE5a-Net的设计实验结果表明,文中方法能有效地提升资源使用效率并给出合理频率设置;
其他文献
针对传统的随机游走算法基于单一灰度信息无法准确分割彩色舌像及其效率较低的问题,提出一种改进的快速随机游走算法.该算法利用带有压缩规则的滑降算法对原图像进行分割;然后设计一种新的复合权函数,建立加权图并进行简约;再利用随机游走算法对加权图进行聚类;最后利用数学形态学算子修整目标区域,得到目标舌像.实验结果表明,文中算法取得了较为理想的效果,其执行效率远高于已有算法和传统的随机游走算法.
40个工业企业和几所大学的专家,参加了由政府资助的“用确定的几何切削刃保证磨削质量”的4年研究项目研讨会。在这个项目中,试验研究并目标明确地继续开发与回转对称工件有关的车
客观图像质量评价(IQA)的目的是设计与主观评价算法尽可能一致的数学模型来度量图像的质量.针对结构相似度(SSIM)和其他一些算法的局限性,考虑到梯度可以反映图像的边缘纹理等结构信息,提出一种快速的全参考型IQA算法,即提升的梯度加权结构相似度(GWL-SSIM)算法.首先定义图像局部块的广义梯度;然后利用其相似性及图像对比度相似性和结构相似性得到局部质量的特征映射图;最后采用广义梯度加权的池化策
针对现阶段钻孔原始地质编录出现的问题以及在教学上面临的困境,提出岩芯模拟系统的研究,并结合理实一体化项目教学法开展教学,初步满足钻孔原始地质编录教学需求,促进教学与
以《国家中长期教育改革和发展规划纲要(2010—2020)》提出的成人高等教育应积极“更新人才培养观念、创新人才培养模式、提高人才培养水平”的要求为指导,遵循成人高等教育
明确毛白杨叶片膨压变化规律及其对环境因子的响应,可以为以叶片膨压作为水分亏缺指标指导灌溉提供理论依据。该研究以滴灌条件下的二年生毛白杨(Populus tomentosa)人工林为研
多边形模型的布尔运算中包含复杂的求交计算以及多边形重建过程,精度控制和处理效率是其中的关键.为了降低布尔运算复杂度,提出一种适合硬件加速的基于渐进式布尔运算的多层次细节网格模型生成方法.该方法采用分层深度图像来近似表示多边形实体的封闭边界,将多边形的求交计算简化为坐标轴平行的采样点的实体内外部判断;为了免去各层次细节模型的重复采样过程,渐进式地将边界采样点归并到低分辨率下的立方体中;运用特征保持的
医院作为特殊的公共场所,人流量大,人员类型错综复杂,加上近年来医患矛盾呈现日益上升的趋势,这些情况都对我国医院的安保工作提出了更高的要求,加大了医院安保工作的难度。
在众多体育专项课教学中,由于羽毛球学习入门简单且技能性要求相对较低,成为了最受高职院校学生欢迎的一门专项课。羽毛球运动对于高职院校培养全面发展的、符合当前社会需求的
古时孔子便有寓教于乐的说法,文学作品同人的教育是分不开的,本文便试图从文学作品的读者、作者以及学生三个方面来谈一谈文学作品对人的教化作用,体会阅读文学作品特别是经