典型文献
GRAPES动力框架中大规模稀疏线性系统并行求解及优化
文献摘要:
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈.分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛.在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访存合并及共享存储器方面的优化措施.实验结果表明,通过预处理优化减少迭代次数对计算性能提升明显,MPI+OpenMP混合并行优化较MPI并行优化性能提高约35%,CUDA并行优化较MPI+OpenMP混合并行优化性能提高约50%,优化性能最佳.
文献关键词:
稀疏线性系统;广义共轭余差法;信息传递接口;OpenMP编程;统一计算架构
中图分类号:
作者姓名:
张琨;贾金芳;严文昕;黄建强;王晓英
作者机构:
青海大学 计算机技术与应用系,西宁 810016;清华大学 计算机科学与技术系,北京 100084
文献出处:
引用格式:
[1]张琨;贾金芳;严文昕;黄建强;王晓英-.GRAPES动力框架中大规模稀疏线性系统并行求解及优化)[J].计算机工程,2022(01):149-154,162
A类:
广义共轭余差法,共享存储器,统一计算架构
B类:
GRAPES,动力框架,稀疏线性系统,赫姆霍兹,数值天气预报,预报系统,系统动力,心部,受限于,硬件资源,求解效率,性能提升,MPI+OpenMP,CUDA,线性方程组,用不完,预处理子,ILU,系数矩阵,条件数,迭代法,CPU,粗粒度,合共,共享内存,细粒度,GPU,数据传输,优化措施,迭代次数,并行优化,优化性能,性能提高,信息传递接口
AB值:
0.321752
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。