典型文献
低质量渲染图像的目标物体6D姿态估计
文献摘要:
从图像中获取目标物体的6D位姿信息在机器人操作和虚拟现实等领域有着广泛的应用,然而,基于深度学习的位姿估计方法在训练模型时通常需要大量的训练数据集来提高模型的泛化能力,一般的数据采集方法存在收集成本高同时缺乏3D空间位置信息等问题.鉴于此,提出一种低质量渲染图像的目标物体6D姿态估计网络框架.该网络中,特征提取部分以单张RGB图像作为输入,用残差网络提取输入图像特征;位姿估计部分的目标物体分类流用于预测目标物体的类别,姿态回归流在3D空间中回归目标物体的旋转角度和平移矢量.另外,采用域随机化方法以低收集成本方式构建大规模低质量渲染、带有物体3D空间位置信息的图像数据集Pose6DDR.在所建立的Pose6DDR数据集和LineMod公共数据集上的测试结果表明了所提出位姿估计方法的优越性以及大规模数据集域随机化生成数据方法的有效性.
文献关键词:
6D位姿估计;域随机化;低质量渲染;RGB图像;Pose6DDR
中图分类号:
作者姓名:
左国玉;张成威;刘洪星;龚道雄
作者机构:
北京工业大学信息学部,北京100124;北京市计算智能与智能系统重点实验室,北京100124
文献出处:
引用格式:
[1]左国玉;张成威;刘洪星;龚道雄-.低质量渲染图像的目标物体6D姿态估计)[J].控制与决策,2022(01):135-141
A类:
低质量渲染,域随机化,Pose6DDR,LineMod
B类:
姿态估计,机器人操作,位姿估计,估计方法,训练模型,训练数据集,泛化能力,数据采集方法,空间位置信息,网络框架,单张,RGB,残差网络,图像特征,流用,旋转角度,平移,图像数据集,公共数据,出位,大规模数据集,化生成
AB值:
0.190502
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。