典型文献
近似强化学习算法研究综述
文献摘要:
强化学习用于解决无模型情况下的优化决策问题,是实现人工智能的重要技术之一,但传统的表格型强化学习方法难以处理具有大规模、连续空间的控制问题.近似强化学习受到函数逼近思想的启发,对价值函数或策略函数参数化表示,通过参数优化间接获得最优行为策略,在视频游戏、棋类对抗及机器人控制等领域应用效果显著.基于此,对近似强化学习算法的研究现状与应用进展进行了梳理和综述.介绍了近似强化学习相关的基础理论;分类总结了近似强化学习的经典算法及一些相应的改进方法;概述了近似强化学习在机器人控制领域的研究进展,并总结了当前面临的若干主要问题,为后续的研究提供参考.
文献关键词:
强化学习;连续空间;值函数近似;直接策略搜索;策略梯度
中图分类号:
作者姓名:
司彦娜;普杰信;孙力帆
作者机构:
河南科技大学 信息工程学院,河南 洛阳 471023;电子科技大学 信息与通信工程学院,成都 611731
文献出处:
引用格式:
[1]司彦娜;普杰信;孙力帆-.近似强化学习算法研究综述)[J].计算机工程与应用,2022(08):33-44
A类:
直接策略搜索
B类:
强化学习算法,算法研究,习用,决无,无模型,优化决策,决策问题,表格,强化学习方法,连续空间,控制问题,函数逼近,对价,价值函数,策略函数,函数参数,参数化,接获,行为策略,视频游戏,棋类,机器人控制,分类总结,改进方法,控制领域,值函数近似,策略梯度
AB值:
0.430371
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。