【摘 要】
:
针对FPGA高级综合中提高矩阵存储并行的问题, 提出了一种基于数组分块的编译优化算法, 用来优化以矩阵乘法为代表的矩阵应用。算法在LLVM编译器架构下对访存密集的数组进行分
【机 构】
:
中国科学院大学,中国科学院电子学研究所可编程芯片与系统研究室
论文部分内容阅读
针对FPGA高级综合中提高矩阵存储并行的问题, 提出了一种基于数组分块的编译优化算法, 用来优化以矩阵乘法为代表的矩阵应用。算法在LLVM编译器架构下对访存密集的数组进行分块, 然后对迭代空间进行对应的合并, 最后修改迭代空间与数据空间之间的数据访问。与AutoESL循环展开算法的实验对比表明, 在分块数目最优的情况下, 矩阵乘法电路的延时平均被降低46%, 资源平均被降低39%。因而该基于数组分块的高级综合编译优化算法能有效降低电路延时和资源使用量。
其他文献
由于住房问题关系着民生,是维系社会稳定的重要因素之一,国内外很多专家学者都纷纷对住房政策的效用进行了多角度多方位的研究。不管这些研究是基于消费者行为理论还是福利经
现代教育主要以多媒体技术为实现手段,作者分析了多媒体技术在教学领域的应用情况后,结合《安全管理学》课程,从更新教学内容、利用网络视频资源和利用国外资源进行比较教学等方
秦玉海说,他的人生梦想之一,就是“让秦玉海这三个字与云台山同在,做到留名于青史和民间”,然而他迷雅好不能自拔.即便在党的十八大以后,秦玉海仍不收手、不收敛,任由其他企
小组合作学习作为对传统教学组织形式的一种突破和补充,已经被教师越来越广泛地运用于以学生发展为本的课堂教学之中,这也是新一轮课程改革所倡导的自主、探索与合作的学习方
以东莞电网3个500 kV变电站为例,分析500 kV变电站220 kV侧母线单相短路电流普遍超标的主要原因,提出限制单相短路电流的措施。针对自耦变压器中性点经小电抗器接地方式,阐释
教学工作是重复性、规律性极强的工作,适合进行程序化管理.教学工作实行程序化管理是教学管理科学化、制度化、规范化的需要,也是教学管理正常化、最优化、高效化的要求.编制教学
资本市场上的IPO现象,即新股首次公开发行(Initial Public Offering)现象,是基于上市公司金融领域的一个热点问题,它自上个世纪70年代以来开始流行。在IPO研究过程中,西方学
目的探讨软骨衍生形态发生蛋白-1(CDMP-1)能否诱导骨髓间充质干细胞(BMSCs)向髓核细胞分化,并检测其诱导的细胞是否具有髓核细胞分泌细胞外基质的功能。方法 BMSCs采用0 ng/m
程序化教学是高校音乐教育专业钢琴教学的主要模式,但在其运用过程中出现了一些问题。本文在现状分析的基础上,着意探究钢琴程序教学的内在规律与特点,并提出改进措施与方法,
本课题来源于兵器工业集团和我校的协同创新项目“××多传感器协同感知技术研究”,是国防“十三五”规划的基础预研课题,旨在解决多传感器协同探测技术中的部署和跟踪问题,