首站-论文投稿智能助手
典型文献
面向多智能体博弈的并行蒙特卡洛树搜索算法研究
文献摘要:
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素.基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法.改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策.结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率.
文献关键词:
多智能体博弈;Pommerman;多进程;并行蒙特卡洛树搜索
作者姓名:
管延霞;刘逊韵;刘运韬;谢旻;徐新海
作者机构:
国防科技大学计算机学院,湖南长沙 410073;军事科学院战争研究院,北京 100091
引用格式:
[1]管延霞;刘逊韵;刘运韬;谢旻;徐新海-.面向多智能体博弈的并行蒙特卡洛树搜索算法研究)[J].计算机工程与科学,2022(12):2128-2133
A类:
多智能体博弈,并行蒙特卡洛树搜索,Pommerman
B类:
蒙特卡洛树搜索算法,算法研究,强化学习算法,动态空间,数级,学习效率,胜率,估值,搜索策略,主进,中子,蒙特卡罗树搜索,资源利用率,决策效率,多进程
AB值:
0.185961
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。