典型文献
基于分层强化学习的通用装配序列规划算法
文献摘要:
对于装配序列规划问题,现有算法大多聚焦于单一的目标构型.对于多目标构型以及大规模问题,现有算法往往存在维数灾难及泛化能力差等问题.为此,利用装配序列规划问题分层结构的特点,提出一种基于分层强化学习的适用于多构型装配任务的通用装配序列规划方法.首先,将装配序列规划问题构建为一个分层的马尔科夫决策过程,其中,上层进行序列规划,下层进行零件的动作规划,符合装配过程层次化的结构,使规划方法更具灵活性,且可解释性更强;其次,针对分层马尔科夫决策过程,提出一种基于分层强化学习的通用装配序列规划算法,提高规划方法对多种目标构型任务的适应能力和泛化能力,以及对目标构型的信息利用率;最后,在搭建的仿真平台上进行验证,结果表明所提方法可以提取到关于装配问题的广义信息,对于不同零件初始位置以及其他多种构型装配任务均具有较好的决策能力,从而验证所提方法的有效性和通用性,表明该算法是适用于多目标构型的更加通用灵活的装配序列规划算法.
文献关键词:
智能装配;装配序列规划;深度强化学习;目标导向;分层强化学习;多构型任务
中图分类号:
作者姓名:
赵铭慧;张雪波;郭宪;欧勇盛
作者机构:
南开大学机器人与信息自动化研究所,天津300350;天津市智能机器人技术重点实验室,天津300350;中国科学院深圳先进技术研究院,广东深圳518055
文献出处:
引用格式:
[1]赵铭慧;张雪波;郭宪;欧勇盛-.基于分层强化学习的通用装配序列规划算法)[J].控制与决策,2022(04):861-870
A类:
多构型任务
B类:
分层强化学习,装配序列规划,划算,规划问题,多聚焦,大规模问题,维数灾难,泛化能力,分层结构,规划方法,问题构建,马尔科夫决策过程,层进,零件,动作规划,装配过程,过程层,层次化,可解释性,信息利用,仿真平台,取到,初始位置,决策能力,通用性,智能装配,深度强化学习
AB值:
0.203019
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。