循环展开相关论文
针对计算机平台在图像处理过程中面临的高能耗问题,研究了电网巡检故障图像识别的低功耗神经网络加速方法.采用直接映射方式将卷积......
当前的MD5解密算法无法适应申威架构,不能充分发挥申威26010众核处理器的性能优势.针对上述问题,采用散列初始化、循环展开、链接......
作为数字信号处理领域的专用处理器,DSP被广泛应用于各种信号处理机上,由于其应用场景多为要求效率高且实时性高的场景,当前流行的......
过去几十年编译器的优化主要使用的是人工调优的方法。随着计算机体系结构的不断发展,编译器的优化变得更加复杂。编译器人工调优......
随着信息技术的发展,人们需要解决的问题越来越复杂,传统的串行程序设计方法已经无法满足许多应用领域的需要,于是并行计算机和并......
快速傅里叶变换(Fast Fourier Transform,FFT)是数字信号处理领域的基础算法之一,在科学计算、图像处理等方面有着广泛的应用。申......
伴随着音视频娱乐行业的迅速进步,数字信号处理器正逐渐成为研究人员重点关注的对象,如何提高数字信号处理器平台上相关应用的性能......
如果要用“气势磅礴”来形容一个国际影展,那么,笔者认为非奥地利超级国际摄影循环展莫属.奥地利超级国际摄影循环展开始于1992年,......
提出了一种在高性能RISC芯片上进行图象中低层处理的寄存器优化方法。使用该方法能使处理速度提高将近一倍,在TMS320c40上所做的实验表明应用该方......
在研究超长指令 (VL IW,Very L ong Instruction Word)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构体征和......
软件流水是开发指令级并行性的重要方法之一.IA-64是支持软件流水的EPIC(显式并行指令计算)体系结构.通过对NAS Benchmarks和Media......
为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端.该任务......
本文对经典矩阵相乘A*B算法提出多种优化方法:根据局部性原理,提出对矩阵B进行转置;根据计算机缓存的大小与矩阵A与矩阵B的规模进......

