典型文献
基于GCC编译器的流式存储优化方法
文献摘要:
针对流式存储访问引起的缓存污染与强制性缺失问题,部分高性能通用处理器平台提供了不经过缓存而直接访问存储器的专用通路及配套指令支持.在常见的流式存储应用场景中,合理采用直访主存方式可以提高芯片存储器系统的整体性能.然而,判断何时使用直访主存能够获得收益对于程序员来说是一项十分繁琐且容易出错的任务,一种行之有效的方法是通过编译器自动实现.因此,文中在深入分析流式存储访问模式使用不同类型访存操作性能收益的基础上,提出了基于GCC编译器的流式存储优化方法.该方法由编译器自动实现对程序员透明,在GCC编译器SSA-GIMPLE阶段对程序循环中具有流式访问特征的连续写或者跨步写进行识别,并根据收益分析与依赖关系筛选优化对象,最后在编译器后端匹配指令模板生成直访主存指令.使用连续/跨步写用例与STREAM测试集及变体在申威国产处理器平台上进行实验评估,结果表明,文中提出的优化方法能够显著缩短流式存储应用程序的执行时间,优化后STREAM测试集的平均加速比为1.31.另外,文中实现的流式存储优化与循环展开优化一起使用效果更好,STREAM测试集的平均加速比能达到1.45.
文献关键词:
GCC编译器;直访主存;编译优化;代码生成;国产处理器
中图分类号:
作者姓名:
高秀武;黄亮明;姜军
作者机构:
江南计算技术研究所 江苏 无锡 214083
文献出处:
引用格式:
[1]高秀武;黄亮明;姜军-.基于GCC编译器的流式存储优化方法)[J].计算机科学,2022(11):76-82
A类:
直访主存,GIMPLE
B类:
GCC,编译器,存储优化,缓存,强制性,通用处理器,不经,接访,存储器,整体性能,何时,程序员,出错,操作性能,SSA,环中,续写,跨步,写进,收益分析,依赖关系,筛选优化,在编,后端,用例,STREAM,测试集,变体,国产处理器,实验评估,应用程序,执行时间,加速比,循环展开,使用效果,比能,编译优化,代码生成
AB值:
0.303547
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。