首站-论文投稿智能助手
典型文献
代码自然性及其应用研究进展
文献摘要:
代码自然性(code naturalness)研究是自然语言处理领域和软件工程领域共同的研究热点之一,旨在通过构建基于自然语言处理技术的代码自然性模型,以解决各种软件工程任务.近年来,随着开源软件社区中源代码和数据规模的不断扩大,越来越多的研究人员注重钻研源代码中蕴藏的信息,并且取得了一系列研究成果.但与此同时,代码自然性研究在代码语料库构建、模型构建和任务应用等环节面临许多挑战.鉴于此,从代码自然性技术的代码语料库构建、模型构建和任务应用等方面对近年来代码自然性研究及应用进展进行梳理和总结.主要内容包括:(1)介绍了代码自然性的基本概念及其研究概况;(2)归纳目前代码自然性研究的语料库,并对代码自然性模型建模方法进行分类与总结;(3)总结代码自然性模型的实验验证方法和模型评价指标;(4)总结并归类了目前代码自然性的应用现状;(5)归纳代码自然性技术的关键问题;(6)展望代码自然性技术的未来发展.
文献关键词:
代码自然性;软件仓库挖掘;代码语言模型
作者姓名:
陈浙哲;鄢萌;夏鑫;刘忠鑫;徐洲;雷晏
作者机构:
信息物理社会可信服务计算教育部重点实验室(重庆大学), 重庆 400044;重庆大学 大数据与软件学院, 重庆 401331;Faculty of Information Technology, Monash University, Melbourne, VIC 3800, Australia;浙江大学 计算机科学与技术学院, 浙江 杭州 310007
文献出处:
引用格式:
[1]陈浙哲;鄢萌;夏鑫;刘忠鑫;徐洲;雷晏-.代码自然性及其应用研究进展)[J].软件学报,2022(08):3015-3034
A类:
代码自然性,开源软件社区,软件仓库挖掘,代码语言模型
B类:
code,naturalness,软件工程,工程领域,自然语言处理技术,工程任务,源代码,钻研,蕴藏,语料库构建,研究及应用,研究概况,前代,验证方法,模型评价指标
AB值:
0.135995
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。