典型文献
基于深度学习的立体影像视差估计方法综述
文献摘要:
三维重建技术常用于自动驾驶、机器人、无人机和增强现实等领域.视差估计是三维重建的关键步骤,随着数据集的增加、硬件和网络模型的发展,深度学习视差估计模型被广泛使用并取得良好效果.然而,这些方法常用室外场景的物体,很少使用在室内场景的数据集中.回顾了双目视差估计的深度学习方法,选用5种深度学习网络:PSMNet(pyramid stereo matching network)、GA-Net(guided aggregation network)、LEAStereo(hierarchical neural architecture search for deep stereo matching)、DeepPruner(learning efficient stereo matching via differentiable patchmatch)、BGNet(bilateral grid learning for stereo matching networks),将其运用在一套真实世界的街景数据集(KITTI2015)和两套室内场景数据集(Middlebury2014、Instereo2K);分析各模型搭建方法,评估深度学习在室内场景影像视差估计中的性能,并与传统的SGM方法进行比较.针对深度学习视差估计方法的研究内容,指出其面临的问题及挑战.
文献关键词:
视差估计;深度学习;室内影像;卷积神经网络
中图分类号:
作者姓名:
王道累;肖佳威;李建康;朱瑞
作者机构:
上海电力大学 能源与机械工程学院,上海 200090
文献出处:
引用格式:
[1]王道累;肖佳威;李建康;朱瑞-.基于深度学习的立体影像视差估计方法综述)[J].计算机工程与应用,2022(20):16-27
A类:
双目视差估计,PSMNet,LEAStereo,DeepPruner,patchmatch,BGNet,Middlebury2014,Instereo2K,室内影像
B类:
估计方法,方法综述,三维重建技术,自动驾驶,增强现实,关键步骤,良好效果,外场,室内场景,深度学习方法,深度学习网络,pyramid,matching,GA,guided,aggregation,hierarchical,neural,architecture,search,deep,learning,efficient,via,differentiable,bilateral,grid,networks,真实世界,街景数据,KITTI2015,两套,模型搭建,搭建方法,SGM,问题及挑战
AB值:
0.291708
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。