典型文献
面向Lustre集群存储的错误日志分析及系统优化
文献摘要:
要集群存储系统的错误日志信息有助于优化存储系统的可用性和稳定性.现有存储系统错误探究主要针对单机存储系统或集群存储系统的部分功能进行分析评估,缺乏在实际应用场景下,同一生产环境中,长时间、多视角的探究工作.新型功能模块的不断融入,使得集群存储系统日益庞杂,集群存储系统自身引发的错误层出不穷,给各类研发人员带来了困扰与挑战.针对以上问题,提出了面向Lustre集群存储的错误日志分析及系统优化策略,通过收集连续1673天的错误日志,研究了近2.26 GB的Lustre错误日志,分析了多个版本Lustre错误的特点与问题,揭示了集群存储系统各方面的不足与错误,研究了不同Lustre版本错误的影响因素,总结了Lustre集群在实际生产环境中的常见错误,并给出了相应的解决方案.对Lustre系统研发有了许多新的见解,并总结了14个发现,最后通过采集333天的新增错误记录对14个发现进行了相关验证,给出了一些系统错误优化实例.相关测试表明,优化实例可以显著减少错误数量,提高系统的可用性和稳定性,研究结果和建议对集群存储系统本身的发展以及集群存储系统的运行和维护都有一定的参考价值.
文献关键词:
Lustre文件系统;日志分析;系统优化;错误;可靠性
中图分类号:
作者姓名:
程稳;李焱;曾令仿;王芳;唐士程;杨力平;冯丹;曾文君
作者机构:
华中科技大学武汉光电国家研究中心信息存储系统教育部重点实验室暨数据存储系统与技术教育部工程研究中心武汉430074;深圳国家基因库 广东深圳518120;之江实验室 杭州311121
文献出处:
引用格式:
[1]程稳;李焱;曾令仿;王芳;唐士程;杨力平;冯丹;曾文君-.面向Lustre集群存储的错误日志分析及系统优化)[J].计算机科学,2022(10):1-9
A类:
B类:
Lustre,日志分析,系统优化,存储系统,日志信息,可用性,单机,分析评估,生产环境,多视角,功能模块,庞杂,研发人员,常见错误,系统研发,发有,误记,测试表明,运行和维护,文件系统
AB值:
0.243295
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。