典型文献
基于模仿学习的自动驾驶智能体构建
文献摘要:
模仿学习是智能体从专家轨迹数据中学习获得尽可能靠近专家策略决策的智能学习方法.近年来,模仿学习已从早期的行为克隆发展到了逆强化学习、生成对抗模仿学习,以及多智能体模仿学习.而目前自动驾驶技术中传感器获取外界信息的能力与深度学习实现的感知环境能力都日趋完善,在决策部分,依靠基于规则的模型可应对大部分常见驾驶场景,但针对规则模型中不适用的极端场景,如何智能化实现安全决策,仍是当前研究的热点问题.本文综述了模仿学习在自动驾驶领域的代表性工作,详细讨论了它们的优势与不足并指出了它们未来的发展趋势.
文献关键词:
模仿学习;生成对抗模仿学习;多智能体模仿学习;自动驾驶
中图分类号:
作者姓名:
杨瑞阳;金蓓弘
作者机构:
中国科学院软件研究所,北京 100190;中国科学院大学,北京 100049
文献出处:
引用格式:
[1]杨瑞阳;金蓓弘-.基于模仿学习的自动驾驶智能体构建)[J].人工智能,2022(04):30-39
A类:
生成对抗模仿学习,多智能体模仿学习
B类:
轨迹数据,专家策略,策略决策,智能学习,从早,行为克隆,逆强化学习,自动驾驶技术,日趋完善,基于规则,驾驶场景,极端场景,智能化实现,安全决策,优势与不足
AB值:
0.261629
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。