首站-论文投稿智能助手
典型文献
高性能计算环境中日志模式提炼方法的研究
文献摘要:
日志分析对于计算机系统的稳定运行起着至关重要的作用,然而日志通常是非结构化的,不利于自动化分析,如何自动化将日志的模式提炼出来并变成结构化的数据具有重要的实际意义.提出了LDmatch算法,该算法以单词匹配率为基础实现了一种日志模式提炼算法.传统的日志匹配算法在进行相似度计算时使用一对一单词匹配法,而LDmatch算法根据两条日志所包含的单词之间的最长公共子序列计算日志之间的相似度,并以此为基础进行日志分类.LDmatch算法还能实时得到日志模板并更新.除此之外,该算法的模式仓库使用了基于哈希表的数据结构进行存储,该存储结构细化了日志的分类,减少了日志匹配时的比较次数,从而提高了日志模式提炼算法的匹配效率.为了验证算法的优势,将LDmatch算法应用于开源数据集以及国家高性能计算环境实际产生的日志数据集,并且使用多种其他日志模式提炼算法进行对比并得出实验结果,最终证明了该算法在准确度、鲁棒性和效率上具有优势.
文献关键词:
日志模式提炼;单词匹配率;日志模板;哈希表
作者姓名:
王晓东;赵一宁;肖海力;王小宁;迟学斌
作者机构:
中国科学院 计算机网络信息中心,北京 100190;中国科学院大学,北京 100049
引用格式:
[1]王晓东;赵一宁;肖海力;王小宁;迟学斌-.高性能计算环境中日志模式提炼方法的研究)[J].计算机科学与探索,2022(10):2264-2272
A类:
日志模式提炼,LDmatch,单词匹配率
B类:
高性能计算,计算环境,日志分析,计算机系统,非结构化,自动化分析,实际意义,匹配算法,相似度计算,一对一,匹配法,最长公共子序列,列计,日志模板,除此之外,仓库,哈希表,数据结构,存储结构,算法应用,开源数据集,日志数据
AB值:
0.222872
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。