首站-论文投稿智能助手
典型文献
一种结合策略价值网络的五子棋自博弈方法研究
文献摘要:
针对传统蒙特卡洛树搜索算法存在"难以在节点的探索和利用之间做出平衡;难以聚焦重要搜索分支"等问题,提出使用策略价值网络完成棋局评估与落子着法生成,将策略价值网络与蒙特卡洛树搜索相结合.策略价值网络指导搜索树的展开,搜索结果用以持续更新网络参数,形成一种自博弈方法,在多轮自博弈中实现算法的迭代优化.实验表明:相较于各种经典搜索算法,所提算法在平均落子时间上降低了约95%,平均对局胜率达到80%以上.
文献关键词:
蒙特卡洛树搜索;深度神经网络;五子棋计算机博弈;自博弈
作者姓名:
刘溜;张小川;彭丽蓉;田震;万家强;任越
作者机构:
重庆理工大学 两江人工智能学院, 重庆 401135;重庆理工大学 人工智能系统研究所, 重庆 400054;重庆工业职业技术学院 人工智能与大数据学院, 重庆 401120;重庆市南开两江中学校, 重庆 401135
引用格式:
[1]刘溜;张小川;彭丽蓉;田震;万家强;任越-.一种结合策略价值网络的五子棋自博弈方法研究)[J].重庆理工大学学报,2022(12):129-135
A类:
自博弈,五子棋计算机博弈
B类:
结合策略,价值网络,博弈方法,蒙特卡洛树搜索算法,出使,使用策略,棋局,落子,着法,搜索树,新网,网络参数,多轮,迭代优化,对局,胜率,深度神经网络
AB值:
0.273012
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。