论文部分内容阅读
通过利用GPU 平台上的CUDA 编译环境,从线程级并行和异步流处理并行两个方面对自适应混合高斯背景建模算法进行并行优化。线程级并行化主要是利用CUDA 的内核函数(kernel),将原算法里的每一个像素的背景更新过程映射到GPU 的一个流处理单元上进行处理,通过多线程的并行执行来加速计算速度。异步流处理优化利用CUDA 编程模型中的流概念,使每个流之间的数据传输和计算重叠进行,隐藏数据传输所带来的时延,从而加速计算过程。实验结果表明,通过线程级并行化和异步流处理优化后,确实可以大幅度地加速混合高斯背景建模算法的执行过程。