首站-论文投稿智能助手
典型文献
协作多智能体深度强化学习研究综述
文献摘要:
多智能体系统是由多个智能体与环境交互组成的分布式决策系统,是分布式人工智能的一个重要研究方向,在复杂未知的现实社会具有广阔的应用前景,如工业、农业、军事和航空航天等群体机器人系统,以及交通控制、资源管理、商业金融和游戏AI等.多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)依托强化学习在未知环境中的序贯决策能力,融合了运筹学、博弈论和群体心理学等众多学科,能够更好地发挥多个智能体的协同优势,进而低成本、高效率地完成复杂任务.本文着重针对无通信环境下的协作多智能体深度强化学习研究成果进行分析、对比和展望.首先,介绍了MARL的研究背景及其学习任务的分类.其次,根据MARL重点研究内容,将多智能体强化学习算法分为价值分解、Actor-Critic和经验回放三个类别加以剖析,并从环境非平稳性、信度分配和收敛性能等不同角度对比算法差异性.最后,分析了MARL领域未来研究所面临的一些挑战,并对MARL的应用和前景进行展望.
文献关键词:
多智能体;深度学习;强化学习;协作学习;价值分解;Actor-Critic;经验回放
作者姓名:
邹启杰;蒋亚军;高兵;李文雪;张汝波
作者机构:
大连大学 信息工程学院,辽宁 大连 116000;大连民族大学 机电工程学院,辽宁 大连 116000
文献出处:
引用格式:
[1]邹启杰;蒋亚军;高兵;李文雪;张汝波-.协作多智能体深度强化学习研究综述)[J].航空兵器,2022(06):78-88
A类:
B类:
多智能体深度强化学习,学习研究,多智能体系统,分布式决策,决策系统,现实社会,航空航天,群体机器人,机器人系统,交通控制,商业金融,融和,Multi,Agent,Reinforcement,Learning,MARL,未知环境,序贯决策,决策能力,运筹学,博弈论,群体心理学,协同优势,复杂任务,通信环境,研究背景,学习任务,多智能体强化学习算法,价值分解,Actor,Critic,经验回放,别加,非平稳性,收敛性能,对比算法,协作学习
AB值:
0.375931
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。