典型文献
预处理共轭梯度算法异构并行求解及优化
文献摘要:
共轭梯度算法是求解对称正定线性系统的重要方法之一,该算法求解问题通常具有稀疏性.随着问题规模的不断增大,单CPU因其存储及计算能力限制已经不能满足大规模稀疏线性方程组求解的实时需求.基于此,本文提出一种基于CPU+GPU异构平台的MPI+CUDA异构并行求解算法.首先,对共轭梯度算法进行了热点性能分析,说明该算法求解时存在的计算困难及挑战;然后,根据共轭梯度算法特性进行了任务划分,实现异构并行算法设计;最后,针对异构并行算法中存在的通信开销、数据传输开销和存储器访问开销等问题,对异构并行算法进行优化以进一步提升求解效率及性能.实验结果表明,与MPI并行和CUDALib并行相比,MPI+CUDA异构混合并行在串行计算部分较少的Jacobi预处理共轭梯度算法上分别获得336%和33%的性能提升,在串行计算部分较多的ILU预处理共轭梯度算法上也能分别获得25%和7%的性能提升,同时结果还显示MPI+CUDA混合并行随着节点数目的增加具有一定可扩展性.
文献关键词:
对称正定线性系统;共轭梯度算法;预处理技术;异构并行
中图分类号:
作者姓名:
张琨;贾金芳;黄建强;王晓英;严文昕
作者机构:
青海大学计算机技术与应用系,西宁810016;清华大学计算机科学与技术系,北京100084
文献出处:
引用格式:
[1]张琨;贾金芳;黄建强;王晓英;严文昕-.预处理共轭梯度算法异构并行求解及优化)[J].小型微型计算机系统,2022(10):2040-2045
A类:
对称正定线性系统,CUDALib
B类:
共轭梯度算法,异构并行,稀疏性,计算能力,线性方程组求解,实时需求,CPU+GPU,异构平台,MPI+CUDA,求解算法,法特,任务划分,并行算法,算法设计,通信开销,数据传输,存储器,求解效率,串行,Jacobi,性能提升,ILU,可扩展性,预处理技术
AB值:
0.227172
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。