首站-论文投稿智能助手
典型文献
基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法
文献摘要:
动态重构是一种有效的综合模块化航空电子系统故障容错方法.重构蓝图定义了系统故障环境下的应用迁移与资源重配置方案,是以最小代价重构恢复系统功能的关键.在复杂多级关联故障模式下,如何快速自动生成有效重构蓝图是其难点.针对该问题,本文提出一种基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法.该方法引入序贯博弈模型,将因受故障影响而需要迁移重构的应用软件定义为博弈中的智能体,根据应用软件优先级确定序贯博弈的顺序.针对序贯博弈过程中多智能体间竞争与合作的问题,算法使用强化学习中的策略梯度,通过控制与环境交互中的动作选择概率来优化重构效果.应用基于有偏估计的策略梯度蒙特卡洛树搜索算法更新博弈策略,解决了传统策略梯度算法震荡难收敛、计算耗时长问题.实验结果表明,与差分进化、Q学习等方法相比,所提算法的优化性能和稳定性均具有显著优势.
文献关键词:
综合模块化航空电子系统;序贯博弈;策略梯度;多智能体强化学习;蒙特卡洛树搜索;重构
作者姓名:
张涛;张文涛;代凌;陈婧怡;王丽;魏倩茹
作者机构:
西北工业大学软件学院,陕西西安710065
文献出处:
引用格式:
[1]张涛;张文涛;代凌;陈婧怡;王丽;魏倩茹-.基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法)[J].电子学报,2022(04):954-966
A类:
系统重构方法
B类:
多智能体强化学习,综合模块化航空电子系统,动态重构,系统故障,故障容错,容错方法,应用迁移,重配置,配置方案,最小代价,恢复系,复系统,关联故障,故障模式,快速自动,自动生成,序贯博弈模型,应用软件,软件定义,优先级,竞争与合作,构效,有偏估计,蒙特卡洛树搜索算法,博弈策略,策略梯度算法,震荡,差分进化,优化性能,显著优势
AB值:
0.242675
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。