典型文献
基于群体熵的机器人群体智能汇聚度量
文献摘要:
群体行为往往能产生远超个体行为的价值和复杂度.为了在个体智能的基础上更有效地衍生出群体智能,需要基于群体熵来科学地衡量群体智能水平,并以群体熵为引导目标,推动群体智能的增强和演进.针对这个重要的科学问题,以无人小车群体为研究对象,提出基于参数共享和群体策略熵的多智能体soft Q learning算法,通过共享智能体的观测信息,并结合最大熵强化学习方法,实现探索型任务中群体策略的持续学习更新.同时,通过将群体熵定义为度量工具,刻画群体学习中熵变化模式,实现对群智汇聚过程的定量分析.
文献关键词:
群体熵;群体智能;深度强化学习
中图分类号:
作者姓名:
冯埔;吴文峻;罗杰;于鑫;田雍恺
作者机构:
北京航空航天大学计算机学院,北京 100191;北京航空航天大学人工智能研究院,北京 100191
文献出处:
引用格式:
[1]冯埔;吴文峻;罗杰;于鑫;田雍恺-.基于群体熵的机器人群体智能汇聚度量)[J].智能科学与技术学报,2022(01):65-74
A类:
群体熵
B类:
群体智能,群体行为,个体行为,以群,科学问题,小车,参数共享,多智能体,soft,learning,观测信息,最大熵,强化学习方法,持续学习,熵变,深度强化学习
AB值:
0.304125
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。