典型文献
Beacon+:面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统
文献摘要:
随着E级计算的屏障被打破,高性能计算已经迈入了新时代.为了满足日益增长的数据访问需求,新兴的技术和存储介质都被运用到了超级计算机中,这使得其架构变得日趋复杂,其性能异常和系统热点定位也变得十分困难.为此,设计并实现了一个面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统——Beacon+.该系统无需修改应用代码/脚本即可对每个应用的数据访问过程进行全路径实时监控与分析.通过在线+离线的压缩方法和分布式缓存/存储等机制,Beacon+在保证系统本身高扩展性、低开销的同时还可以持续稳定地提供I/O诊断服务.以神威新一代超级计算机为部署平台,通过I/O标准测试应用和实际应用证明了Beacon+的低开销和高准确性,以及I/O诊断的高效性.
文献关键词:
I/O监控;数据压缩;I/O诊断;异常检测;性能瓶颈优化
中图分类号:
作者姓名:
杨斌;王敬宇;刘世超;邵明山;肖伟;陈起;何晓斌;刘卫国;薛巍
作者机构:
山东大学软件学院,山东 济南 250101;国家超级计算无锡中心,江苏 无锡 214072;国家并行计算机工程技术研究中心,北京 100080;清华大学计算机科学与技术系,北京 100084
文献出处:
引用格式:
[1]杨斌;王敬宇;刘世超;邵明山;肖伟;陈起;何晓斌;刘卫国;薛巍-.Beacon+:面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统)[J].计算机工程与科学,2022(09):1521-1531
A类:
Beacon+,分布式缓存,性能瓶颈优化
B类:
超级计算机,轻量级,端到端,性能监控,分析诊断,诊断系统,高性能计算,数据访问,存储介质,热点定位,十分困难,代码,脚本,全路径,实时监控,离线,压缩方法,保证系统,高扩展性,开销,持续稳定,神威,数据压缩,异常检测
AB值:
0.28876
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。