【摘 要】
:
目前GPU已经成为提高算法性能的一个重要途径,OpenCL 是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU 或其他类型的多核/众核处理器组成.本文主要介绍基于OpenC
【机 构】
:
Laboratory of Parallel Software and Computational Science,Institute of Software,Chinese Academy of S
论文部分内容阅读
目前GPU已经成为提高算法性能的一个重要途径,OpenCL 是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU 或其他类型的多核/众核处理器组成.本文主要介绍基于OpenCL 框架在GPU 上对开源视觉库(OpenCV)中访存密集型函数addWeighted 和magnitudeSqr 进行实现和优化,优化方法主要有向量化读取,NDrange 优化和内存对齐,并将结果与CPU,CUDA 进行了对比分析,相较于CPU 版本最高达到了74.4 的加速比.
其他文献
高性能计算机系统规模越来越大,系统可靠性问题越来越严重。检查点技术是最典型的容错方法,但是因为并行文件系统的性能提高相对缓慢,数据写带宽低,传统检查点方法产生了严峻
并行流水线Sn 扫描算法是在非结构网格上求解粒子输运方程的一种重要方法。本文在分析JASMIN框架下的并行流水线Sn 扫描算法的基础上,在多核集群平台上,算法并行性,通信效率
资源分配策略是云计算研究领域中的一项重要研究点,研究人员提出了多种资源共享与分配策略,然而很少有工作关注不同云计算服务的用户群体的行为习惯对资源分配策略的影响.
生物序列比对是生物信息学领域重要的研究工具,主要用于确定序列的生物属性。由于该领域应用的广泛性、计算的复杂性以及海量数据特征,对计算机性能提出越来越高的高求,迫切
面对国外大型金融集团的纷纷涌入,我国保险公司要想在越来越激烈的市场竞争中取胜,需积极调整经营战略,金融集团模式,即金融控股公司作为一种已经受住考验的成功的金融企业组
虽然云计算在科学计算和互联网应用上已经取得了很大的收益,但是由于规模庞大,不论是其拥者还是用户都将节省开销作为首要目标。然而,相关工作大多只考虑了拥有者的运营开销
本文提出了一种SSD内部多通道之间的写操作调度策略.该策略记录每个通道的数据写入量,每次数据刷新选择数据写入量最小的通道.DRAM被划分为两部分,分别作为读缓存和写缓存,
随着国际间航海事业的发展,海上运输以运输量大、方便、运费低廉的优点已成为国际运输的主要方式。繁忙的海上运输,载货客量大、航程远、沿途寄港多、人员来往频繁,因而带来
游泳是一项很好的体育运动,不仅能增强体质,而且可以锻炼意志,对于身心健康是有益的。因此,每到夏季,人们成群结队地到天然水域或人工游泳池,进行游泳锻炼。但是,相对地医院
提出一种面向大规模同时多线程处理器可扩展高速缓存的动态划分方法.将文献所提的机制扩展到多体高速缓存中.线程的内存访问特征变化迅速,因此在运行时收集同时多线程的缺