基于日志信息的不可重复构建原因分类|马钊;刘东;任志磊;江贺 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于日志信息的不可重复构建原因分类

文献摘要：

可重复构建指在预定义的构建环境下重新创建二进制工件的能力.由于可重复构建具有保证软件构建环境安全和提高软件构建和分发效率的作用,许多开源软件存储库(如Debian)开展了软件可重复构建实践.然而,由于缺乏足够的判断信息和源文件的复杂多样,确定软件不可重复构建的原因仍是一项费时费力的工作.为此,研究了基于机器学习的软件不可重复构建原因的分类检测.研究了4种典型的不可重复构建原因,即时间戳、文件顺序、随机性和语言环境.利用word2vec产生的词向量对文本日志进行表示,然后配合logistic回归模型,对差异日志和构建日志合并的文本语料进行学习和训练,从而实现对不可重复构建原因的自动分类.对算法进行了实现,并在671个不可重复构建的Debian软件包上进行实验,实验结果表明,该方法达到了80.75％的宏平均精度和86.07％的宏平均召回率,优于其他常用的机器学习算法.此外,还分析了差异日志和构建日志的相关性和重要性,实验结果表明两者对不可重复构建原因的分类都非常重要,缺一不可.该方法为不可重复构建原因自动分类提供了可靠的研究依据.

文献关键词：

可重复构建;原因分类;差异日志;构建日志;机器学习

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机软件（TP31） / 程序设计、软件工程（TP311）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

作者姓名：

马钊;刘东;任志磊;江贺

作者机构：

大连理工大学软件学院辽宁大连 116620

文献出处：

计算机科学

引用格式：

[1]马钊;刘东;任志磊;江贺-.基于日志信息的不可重复构建原因分类)[J].计算机科学,2022(12):109-117

A类：

可重复构建,Debian,差异日志,构建日志

B类：

日志信息,原因分类,预定,建环,新创建,二进制,工件,软件构建,环境安全,开源软件,储库,构建实践,源文件,费时费力,基于机器学习,分类检测,时间戳,随机性,语言环境,word2vec,词向量,本日,logistic,语料,自动分类,软件包,包上,召回率,机器学习算法,缺一不可

AB值：

0.260059

相似文献

基于改进自适应k均值聚类的三维点云骨架提取的研究

鲁斌;范晓明-华北电力大学计算机系保定071000

LMSA:NVM环境下高性能动态图处理数据结构

祝贺;华强胜;金海;廖小飞-大数据技术与系统国家地方联合工程研究中心武汉 430074;服务计算技术与系统教育部重点实验室武汉 430074;集群与网格计算湖北省重点实验室武汉 430074;华中科技大学计算机科学与技术学院武汉 430074

噪音过滤和深度学习相结合的安全缺陷报告识别

蒋远;牟辰光;苏小红;王甜甜-哈尔滨工业大学计算学部哈尔滨 150001

基于校园上网行为感知的学生成绩预测方法

姚丽;崔超然;马乐乐;王飞超;马玉玲;陈勐;尹义龙-山东大学软件学院济南 250100;山东财经大学计算机科学与技术学院济南 250014;齐鲁师范学院网络信息中心济南 250001;山东建筑大学计算机科学与技术学院济南 250101

一种适用于分布式存储集群的纠删码数据更新方法

章紫琳;刘铎;谭玉娟;吴宇;罗龙攀;王纬略;乔磊-重庆大学计算机学院重庆 400044;北京控制工程研究所北京 100080

小样本负载序列的结构化预测方法

刘春红;张志华;焦洁;程渤-河南师范大学计算机与信息工程学院,河南新乡 453007;智慧商务与物联网技术河南省工程实验室,河南新乡 453007;北京邮电大学网络与交换技术国家重点实验室,北京 100876

高性能计算环境中日志模式提炼方法的研究

王晓东;赵一宁;肖海力;王小宁;迟学斌-中国科学院计算机网络信息中心,北京 100190;中国科学院大学,北京 100049

基于自定义日志的Fabric的共识交易轨迹可视化追踪方法

李杉杉;王岩泽;邹英龙;陈焕雷;张贺;吴欧-南京大学软件学院,南京 210023;计算机软件新技术国家重点实验室(南京大学),南京 210023;中国农业银行研发中心,广州 511400

RB-Raft:一种抗拜占庭节点的Raft共识算法

李淑芝;邹懿杰;邓小鸿;罗志琼;刘惠文-江西理工大学信息工程学院,江西赣州341000;赣南科技学院电子信息工程学院,江西赣州341000

基于多尺度方向数值模式的肝功能分级方法

黄炜嘉;张正言;杨魏;李垣江;李效龙;王泽辉-江苏科技大学电子信息学院,江苏镇江212100;江苏省人民医院介入科,江苏南京210029

一种用于异常检测的自动日志分析方法

葛志辉;谭悦;李陶深;叶进-广西大学计算机与电子信息学院,南宁530004

日志多维度无监督异常检测算法

邱连涛;李晓戈;胡飞雄;胡立坤;张东晨;马鲜艳-西安邮电大学计算机学院,西安710121;陕西省网络数据分析与智能处理重点实验室,西安710121;深圳腾讯计算机系统有限公司智能化运维,广东深圳518000;腾讯科技(上海)有限公司,上海200030

利用维基百科点击流的概念依赖关系识别方法

胡成;陈昊;肖奎-湖北大学计算机与信息工程学院,武汉430062

融合跨阶段深度学习的脑肿瘤MRI图像分割

夏峰;邵海见;邓星-江苏科技大学计算机学院, 镇江 212003;东南大学自动化学院复杂工程系统测量与控制教育部重点实验室, 南京 210009

大脑多模态成像技术定量研究进展

叶慧慧;何宏建;方静宛;童琪琦;周子涵;刘华锋-浙江大学现代光学仪器国家重点实验室,光电科学与工程学院,杭州 310027;浙江大学生物医学工程教育部重点实验室,生物医学工程与仪器科学学院,杭州 310027;之江实验室健康医疗大数据研究中心,杭州 311121

基于CNN-BiLSTM模型的日志异常检测方法

孙嘉;张建辉;卜佑军;陈博;胡楠;王方玉-郑州大学中原网络安全研究院,郑州450001;中国人民解放军战略支援部队信息工程大学,郑州450001

云环境大数据工作流编排管理系统研究综述

曹禹;李晓辉;刘忠麟;贾贺;费志伟-华北计算技术研究所基础五部,北京100083

FOCoR:一种基于特征选择优化的课程推荐技术

王扬;陈梅;李晖-贵州大学计算机科学与技术学院,贵州贵阳 550025

基于机器学习的日志异常检测综述

闫力;夏伟-江南计算技术研究所,无锡214084

AS-OCT图像下的自动皮质性白内障分类框架

徐格蕾;章晓庆;肖尊杰;Risa Higashita;陈婉;袁进;刘江-南方科技大学,深圳518055;Tomey 公司,名古屋 4510051;中山大学,广州510060;中国科学院宁波材料技术与工程研究所慈溪生物医学工程研究所,宁波315201;广东省类脑智能计算重点实验室,深圳518055

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。