首站-论文投稿智能助手
典型文献
基于深度强化学习的网络攻击路径规划方法
文献摘要:
攻击路径规划对实现自动化渗透测试具有重要意义,在现实环境中攻击者很难获取全面准确的网络及配置信息,面向未知渗透测试环境下的攻击路径规划,提出了基于深度强化学习的攻击路径规划方法.首先,对渗透测试问题的状态空间和动作空间进行形式化描述,引入信息收集动作增强对环境的感知能力.然后,智能体通过与环境的自主交互进行学习,寻找最大化长期收益的最优策略,从而指导攻击者进行路径规划.当前深度强化学习算法应用于攻击路径规划存在适应性不强和收敛困难等问题,限制了其处理复杂渗透测试环境的能力.智能体在训练初期通过盲目探索得到的动作序列在维度迅速增长时质量会急剧下降,有时很难完成目标,而且低质量的动作序列大量积累会导致算法不收敛甚至神经元死亡.针对此问题,本文提出的深度强化学习算法在DDQN算法的基础上增加了路径启发信息和深度优先渗透的动作选择策略.路径启发信息充分利用历史经验,在训练初期对智能体的学习过程加以引导,深度优先渗透的动作选择策略在一定程度上对动作空间进行了剪枝,加速智能体的学习过程.最后,通过与其他深度强化学习算法在相同实验条件下的对比,验证了本文算法收敛速度更快,运行时间缩短30%以上.
文献关键词:
深度强化学习;路径启发信息;深度优先渗透的动作选择策略;攻击路径规划
作者姓名:
高文龙;周天阳;赵子恒;朱俊虎
作者机构:
信息工程大学 郑州 中国 450001
文献出处:
引用格式:
[1]高文龙;周天阳;赵子恒;朱俊虎-.基于深度强化学习的网络攻击路径规划方法)[J].信息安全学报,2022(05):65-78
A类:
攻击路径规划,路径启发信息,深度优先渗透的动作选择策略
B类:
网络攻击,路径规划方法,自动化渗透测试,现实环境,攻击者,配置信息,测试环境,试问,状态空间,动作空间,形式化描述,信息收集,感知能力,智能体,自主交互,交互进行,期收,最优策略,深度强化学习算法,算法应用,动作序列,急剧下降,低质量,不收,神经元死亡,DDQN,学习过程,剪枝,实验条件,收敛速度,运行时间
AB值:
0.199657
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。