论文部分内容阅读
随着计算机体系结构的发展,众核体系结构越来越成为科研人员关注的焦点。众核技术的发展要求能够利用片上大规模的并行资源,高效加速应用程序的性能。本文针对科学计算中的经典程序LU分解进行了深入研究。通过仔细分析算法,指出了2D scatter算法的负载不均衡问题。我们实现了基于比特翻转异或的Bit Reverse XOR(BRX)算法,提出了一个负载均衡策略算法DABP。为了评估三种负载均衡算法的效果,提出了两种不同的评价负载均衡的函数。试验结果表明,在使用64个处理嚣核的情况下,DABP算法加速比达到46,是3个算法中性能最好的。