论文部分内容阅读
异构的处理器上的发展中的平行应用程序正在面对存储器墙的挑战,由于为存储器存取的本地存储,有限带宽和长潜伏的有限能力。瞄准这个问题,一条并行化途径为 CG 与六个记忆优化计划被建议,他们的四个计划根本瞄准有点稀少的矩阵向量增加(SPMV ) 操作。在 IBM QS20 上进行了,分别地,直到 21 和 133 的并行化途径罐头活动范围与单个力量相比与尺寸 A 和 B 预定加速处理器元素。最后,结论被得出房间上的存储器存取的山峰带宽能在 SPMV 被获得,简单计算在异构的处理器和铺开环的罐头兽皮本地人存储上是