首站-论文投稿智能助手
典型文献
基于神威·太湖之光的非结构网格计算加速算法
文献摘要:
在国产异构众核平台神威·太湖之光上的非结构网格计算具有稀疏存储、离散访存、数据依赖等特点,严重制约了众核处理器的性能发挥.为解决稀疏存储和离散访存问题,提出一种N阶对角染色算法,以有效平衡主从核计算并利用从核将全局访存转化为LDM访问.针对数据依赖造成的计算竞争问题,采用自适应和无依赖的任务划分方法,避免并行计算时的数据冲突.为对处理器架构和非结构网格计算进行优化,采用主核与从核异步并行的方式,差异化使用主从核以充分利用硬件资源,同时,取消处理器提供的寄存器通信机制,降低从核阵列的同步开销同时便于扩展到新一代神威平台.此外,使用计算访存异步重叠技术来充分隐藏访存延迟.利用SpMV、Integration、calcLudsFcc算子进行实验,结果表明,相比主核实现,组合加速算法在不同算例规模下平均取得了10倍的加速效果,加速比最高可达24倍,N阶对角染色算法相比非染色分块算法取得了超过5.8倍的性能加速,有效提升了数据局部性和计算并行度.该算法对有依赖关系的计算冲突算子同样具有良好的加速性能,验证了自适应和无依赖任务划分方法的有效性.
文献关键词:
神威·太湖之光;非结构网格;众核加速;离散访存;无依赖任务划分
作者姓名:
许乐;安虹;陈俊仕;张鹏飞;武铮
作者机构:
中国科学技术大学 计算机科学与技术学院,合肥 230026
文献出处:
引用格式:
[1]许乐;安虹;陈俊仕;张鹏飞;武铮-.基于神威·太湖之光的非结构网格计算加速算法)[J].计算机工程,2022(12):45-53
A类:
离散访存,寄存器通信,SpMV,calcLudsFcc,无依赖任务划分
B类:
神威,太湖,非结构网格,网格计算,速算,异构众核,数据依赖,对角,染色算法,主从,核计,LDM,竞争问题,划分方法,并行计算,数据冲突,处理器架构,算进,异步,硬件资源,通信机制,开销,存异,访存延迟,Integration,核实,例规,速效,加速比,分块算法,局部性,并行度,依赖关系,加速性能,众核加速
AB值:
0.338526
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。