典型文献
基于图元光栅化触发的高效GPU深度数据预取
文献摘要:
数据预取技术已经广泛应用在各类中央处理器(CPU)设计领域,取得了很好的效果.而图形处理器(GPU)对存储带宽的需求更为巨大,与图形渲染流水线和图形算法直接相关,且数据访问模式与通用CPU有显著差异,需要更有针对性的有效数据预取机制.针对GPU深度测试关键功能,本文提出一种图元光栅化触发的高效深度数据预取机制——DPRT,通过图元光栅化过程中实时扫描到的片段块地址来触发Z缓存(Z Cache)的深度数据预取,同时为了适应不同实现中流水线处理延迟,为Z Cache数据块增加访问一次标志(OTT),保证深度数据预取有效性.实验结果表明,DPRT使深度测试时Z Cache访问命中率平均提升9.51%,深度测试延迟平均降低40.43%.
文献关键词:
图形处理器(GPU);光栅化;扫描;深度测试
中图分类号:
作者姓名:
田泽;张骏;许宏杰
作者机构:
西安翔腾微电子科技有限公司 西安 710068;航空工业西安航空计算技术研究所 西安 710068;集成电路与微系统设计航空科技重点实验室 西安 710068
文献出处:
引用格式:
[1]田泽;张骏;许宏杰-.基于图元光栅化触发的高效GPU深度数据预取)[J].高技术通讯,2022(11):1126-1133
A类:
光栅化,数据预取技术,DPRT
B类:
图元,GPU,深度数据,中央处理器,CPU,图形处理器,渲染,流水线,数据访问,有效数据,深度测试,描到,地址,缓存,Cache,中流,数据块,OTT,命中率
AB值:
0.251456
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。