典型文献
基于数据分布一致性的处理器硬件性能计数器复用估计方法
文献摘要:
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov 正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了 OLE算法,并在主 流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了 10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了 18.8%和17.7%.
文献关键词:
处理器硬件性能计数器;复用技术;性能分析;高性能计算;估计方法
中图分类号:
作者姓名:
林新华;王杰;王一超;左思成
作者机构:
上海交通大学高性能计算中心 上海 200240
文献出处:
引用格式:
[1]林新华;王杰;王一超;左思成-.基于数据分布一致性的处理器硬件性能计数器复用估计方法)[J].计算机研究与发展,2022(06):1192-1201
A类:
处理器硬件性能计数器,OCOE,NeoMPX
B类:
数据分布,分布一致性,估计方法,件数,受限于,计算器,流处理,数百个,寄存器,硬件计数器,复用技术,multiplexing,分时复用,局部性,估计算法,工作包,Kolmogorov,Smirnov,正态性检验,代码,记录单,one,counter,event,轮廓线,outline,estimation,OLE,开源,X86,ARM,PAPI,默认,高性能计算
AB值:
0.326744
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。