典型文献
基于用户行为的超级计算机作业失败预测方法
文献摘要:
超级计算机的规模不断扩大,与此同时,科学应用的复杂性也在不断增加,这导致了超级计算机上许多作业失败.作业失败会造成资源浪费,排队作业等待时间延长,严重影响系统的执行效率.提前预测作业失败,就可以采取必要的措施提升系统资源利用率和系统执行效率,这对未来的E级超级计算机至关重要.为此,尝试研究从已知的传统特征和构建特征中预测作业失败,发现能够反映用户工作行为模式和提交行为模式的特征及处理方式.通过结合行为特征和传统特征,提出基于树结构模型的综合框架来预测作业失败.实验结果表明,预测效果优于其他相关方法.
文献关键词:
系统执行效率;作业日志分析;用户行为;作业失败预测;机器学习
中图分类号:
作者姓名:
唐阳坤;鲜港;杨文祥;喻杰;张晓蓉;王耀彬
作者机构:
西南科技大学计算机科学与技术学院,四川绵阳 621010;中国空气动力研究与发展中心计算空气动力研究所,四川绵阳 621050;国防科技大学计算机学院,湖南长沙 410073
文献出处:
引用格式:
[1]唐阳坤;鲜港;杨文祥;喻杰;张晓蓉;王耀彬-.基于用户行为的超级计算机作业失败预测方法)[J].计算机工程与科学,2022(10):1753-1761
A类:
作业失败预测,作业日志分析
B类:
用户行为,超级计算机,科学应用,资源浪费,排队,等待时间,影响系统,提前预测,提升系统,系统资源,资源利用率,系统执行效率,传统特征,工作行为,行为模式,提交,交行,行为特征,树结构,综合框架,相关方法
AB值:
0.283843
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。