FAILED
首站-论文投稿智能助手
典型文献
面向国产异构众核架构的CFD非结构网格计算并行优化方法
文献摘要:
神威太湖之光在2016-2018年度全球超算top500榜单中排名第一,峰值性能为125.4 PFlops,其计算能力主要归功于国产SW26010众核处理器.由于CFD非结构网格计算存在拓扑关系复杂、离散访存问题严重、存在强相关的线化方程求解等问题,导致CFD非结构网格计算一直是国产众核超级计算机移植与优化的难题.为充分发挥国产异构众核架构的计算效能,首先,提出了 一种数据重构模型,提高了数据的局部性和可并行性,使得数据结构更加适应众核架构的特点;然后,针对非结构网格数据存放的无序性导致的离散访存问题,提出了一种基于信息关系预存的离散访存优化方法,将离散访存转化为连续访存;最后,对于存在强相关的线化方程求解问题,引入了从核阵列流水线并行的思想,实现了众核并行.优化后CFD非结构网格计算的整体性能相比原始版本提升了 4.19倍,相比通用CPU提升了 1.2倍,并扩展到62.4万计算核心的并行规模,能保持64.5%的并行效率.
文献关键词:
计算流体力学;异构众核;神威超级计算机;非结构网格;并行计算
作者姓名:
陈鑫;李芳;丁海昕;孙唯哲;刘鑫;陈德训;叶跃进;何香
作者机构:
国家超级计算无锡中心 江苏无锡214000;中国空气动力研究与发展中心 四川绵阳621000
文献出处:
引用格式:
[1]陈鑫;李芳;丁海昕;孙唯哲;刘鑫;陈德训;叶跃进;何香-.面向国产异构众核架构的CFD非结构网格计算并行优化方法)[J].计算机科学,2022(06):99-107
A类:
top500,PFlops,离散访存
B类:
异构众核,CFD,非结构网格,网格计算,并行优化,太湖,超算,榜单,中排,排名第,计算能力,力主,归功于,SW26010,处理器,拓扑关系,问题严重,线化,算效,数据重构,重构模型,局部性,并行性,得数,数据结构,网格数据,存放,信息关系,预存,访存优化,流水线,整体性能,原始版本,CPU,并行效率,计算流体力学,神威超级计算机,并行计算
AB值:
0.338149
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。