首站-论文投稿智能助手
典型文献
基于Transformer的通用和鲁棒体素特征学习的目标检测
文献摘要:
自注意力网络和Transformer主导了机器翻译和自然语言处理领域,并在诸如图像分类和目标检测等图像视觉任务中显示出巨大潜力.受到Transformer在2D图像视觉任务中取得的巨大进步的启发,提出了一种基于传统Transformer的新颖和鲁棒的体素特征编码器.首先,探究自注意力对序列数据的排列不变性,并将其应用于点云数据处理.其次,基于自注意力构造体素特征层,根据体素内所有点之间的空间关系和上下文信息交换自适应地学习体素的局部和鲁棒上下文.最后,构建了以体素特征层为核心的通用3D目标检测框架.VFT(voxel feature learning with Transformer)是通用的体素特征提取器,可以嵌入任何其他基于体素方法的3D物体检测框架中.在KITTI数据集上进行的实验结果表明,本方法在3D目标检测方面表现出优越的性能.
文献关键词:
3D目标检测;自注意力网络;基于Transformer的体素特征学习;点云;编码解码器
作者姓名:
李阳;葛洪伟
作者机构:
江南大学江苏省模式识别与计算智能实验室,江苏无锡214122;江南大学人工智能与计算机学院,江苏无锡214122
文献出处:
引用格式:
[1]李阳;葛洪伟-.基于Transformer的通用和鲁棒体素特征学习的目标检测)[J].测试科学与仪器,2022(01):51-60
A类:
体素特征提取
B类:
Transformer,特征学习,目标检测,自注意力网络,机器翻译,自然语言处理,图像分类,视觉任务,巨大潜力,2D,巨大进步,特征编码,编码器,序列数据,不变性,点云数据处理,有点,空间关系,上下文信息,信息交换,地学,检测框架,VFT,voxel,feature,learning,何其,物体检测,KITTI,编码解码器
AB值:
0.335837
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。