典型文献
面向神威高性能多核处理器的并行编译优化方法
文献摘要:
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低.为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术.并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序.实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率.
文献关键词:
神威高性能多核处理器;OpenMP编程;并行域重构;fork-join模型;单程序多数据模型
中图分类号:
作者姓名:
周雍浩;徐金龙;李斌;钱宏;聂凯
作者机构:
郑州大学 信息工程学院,郑州 450001;数学工程与先进计算国家重点实验室,郑州 450001;江南计算技术研究所,江苏 无锡 214083
文献出处:
引用格式:
[1]周雍浩;徐金龙;李斌;钱宏;聂凯-.面向神威高性能多核处理器的并行编译优化方法)[J].计算机工程,2022(09):130-138
A类:
神威高性能多核处理器,编译系统,并行域重构,单程序多数据模型,SW1621,NPB3,OMP2012
B类:
编译优化,服务器,并行化,申明,并行性,OpenMP,过充,fork,join,循环嵌套,重构优化,优化技术,重构技术,嵌套循环,环中,线程,控制开销,程序转换,测试集,SPEC,执行效率
AB值:
0.214629
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。