论文部分内容阅读
稀疏矩阵相乘是在科学和工程计算中有广泛应用,是科学计算中的一种常用的基本运算。但也面临着数据量大,非零值分布不规则,负载难均衡,计算结果矩阵的列指数无规则分布等问题。通过矩阵分块、优化数据传输、负载均衡、改良并行快速排序法方法来解决上述问题,提高了计算效率。在多线程下计算速度比Intel MKL 的SPBLAS 平均提高56%。同时,还通过MPI+OpenMP 进行混合并行优化,在共享存储系统上两者有类似的计算速度。