首站-论文投稿智能助手
典型文献
一种多重优先经验回放的麻将游戏数据利用方法
文献摘要:
针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神经网络.为了验证算法的有效性,构建了大众麻将自博弈平台进行相应的实验验证.实验结果表明:相比随机经验回放方法,新方法将麻将AI的训练速度提升了22.5%.
文献关键词:
大众麻将;多重优先经验回放;时序差分误差;自博弈
作者姓名:
李淑琴;李奕
作者机构:
北京信息科技大学 计算机学院, 北京 100101;感知与计算智能联合实验室, 北京 100101
引用格式:
[1]李淑琴;李奕-.一种多重优先经验回放的麻将游戏数据利用方法)[J].重庆理工大学学报,2022(12):162-169
A类:
多重优先经验回放,大众麻将,时序差分误差,自博弈
B类:
游戏数据,数据利用,时经,经验回放机制,均匀采样,复杂程度,优先级,取来,训练速度
AB值:
0.136761
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。