典型文献
基于深度学习的Linux内核引用计数字段识别方法
文献摘要:
引用计数机制是现代软件中一种常见的内存管理技术.引用计数错误往往会导致内存泄露、释放后使用(use after free)等严重的安全问题.现有致力于提高引用计数安全性的工作都依赖于对引用计数的字段进行识别.然而,由于类似于Linux等软件系统的代码十分复杂,在代码中识别出引用计数字段是一项十分困难的工作.传统的基于代码模式匹配的引用计数字段识别方法一方面存在需要专家经验总结规则,人工开销大的问题;另一方面存在总结的模式无法覆盖所有情况,召回率较低等局限.针对这些问题,发现与字段有关的代码行为以及字段的名称可以用来表征这个字段的特征,帮助识别引用计数字段.基于这两个层面的特征,设计了一种基于多模态深度学习的引用计数字段识别方法,并面向Linux内核实现原型系统.测试数据表明:该原型系统的精确率、召回率分别为96.98%和93.54%,而传统的基于代码模式匹配的方法没有识别出任何引用计数字段.此外,在Linux内核上发现61个引用计数字段使用不安全的数据类型,并对其中21个向Linux内核社区提交数据类型转换补丁以提高引用计数字段的安全性,其中6个已经被合并到Linux内核代码主分支.
文献关键词:
引用计数识别;静态程序分析;多模态深度学习
中图分类号:
作者姓名:
谈心;杨悉瑜;曹家俊;张源
作者机构:
复旦大学 计算机科学技术学院, 上海 201203
文献出处:
引用格式:
[1]谈心;杨悉瑜;曹家俊;张源-.基于深度学习的Linux内核引用计数字段识别方法)[J].软件学报,2022(06):2030-2046
A类:
引用计数识别
B类:
Linux,字段,内存管理,管理技术,数错,内存泄露,use,after,free,有致,软件系统,代码,十分复杂,十分困难,模式匹配,专家经验,开销,有情,召回率,多模态深度学习,核实,原型系统,测试数据,精确率,出任,数据类型,提交,类型转换,换补,补丁,并到,静态程序分析
AB值:
0.31794
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。