典型文献
SiamCross:孪生交叉的目标跟踪对象感知网络
文献摘要:
近来,基于孪生架构的方法因其能在保持良好速度的同时取得较显著的性能,引起了视觉跟踪领域的广泛关注.然而,孪生网络分支通常是独立的,缺乏信息交互,这限制了模型性能的进一步提升.为了增强孪生网络分支的协作能力,本文提出基于孪生架构的交叉感知网络模型——SiamCross(Siamese Cross Object-Aware Network).孪生网络双分支特征提取是提升模型性能的首要核心操作,区分目标和语义背景在很大程度上依赖模型挖掘的特征鲁棒性.在SiamCross中,我们首先基于孪生网络分支的互监督,设计了全新的孪生交叉感知子网络(Siamese Cross-Aware Network,SCAN)用来提取鲁棒特征.SCAN允许孪生分支彼此全方位高效协同工作,使模板分支可充分利用特征丰富的上下文语义信息,对目标产生更具有区分性的表示;搜索分支结合模板特征,也主动学习到了目标的本质信息.另一方面,无锚框算法将跟踪任务直接映射为对每个像素的分类和回归,网络分支特征可各自聚焦于目标的局部与全局空间信息.以上两种特征具有很好的潜在局部-全局互补性.具体而言,回归特征学习到了更多的目标全局尺寸信息,但同时也引入了周围背景信息,而分类分支专注于学习局部中心定位信息.二者结合,有利于抑制回归特征的背景信息表达.同时,回归特征会在目标周边位置进行突出响应,揭示目标所在区域,也为分类分支进行定位提供了有益参考.为充分利用以上不同的分支空间特征信息来获得更精确的跟踪结果,我们又提出了新型的目标注意力交互网络(Obejct-Attention Interaction Network,OAIN),并将其融入到SiamCross中.OAIN包含并行交叉注意力模块(Parallel Cross Attention Module,PCA)和自适应可形变交叉对齐模块(Adaptive Deformable Cross Align Module,ADCA).PCA模块通过对分支中局部与全局信息的巧妙融合,提升了目标状态估计的准确性.为了进一步使回归特征和目标区域对齐,缓解特征对齐失焦导致的分类分支参考信源可靠性大幅度降低,我们为ADCA模块设计了自适应空间转换操作,可以使得回归特征更好反映目标所在区域.最终,ADCA模块完善了无锚框网络的高效交互机制.最后,我们在OTB2015、VOT2018/2019、GOT-10k和LaSOT五个具有挑战性的公开基准中对SiamCross进行了详尽的实验评估.实验结果显示,SiamCross与当前先进的跟踪器SiamRPN++、ATOM及DiMP相比,均取得了更优异的综合表现,并且可实现实时跟踪.
文献关键词:
视觉目标跟踪;孪生网络;信息交互;交叉注意力
中图分类号:
作者姓名:
黄旺辉;冯永;强保华;裴钰璇;罗越
作者机构:
重庆大学计算机学院 重庆 400044;重庆大学信息物理社会可信服务计算教育部重点实验室 重庆 400044;桂林电子科技大学广西可信软件重点实验室 广西桂林 541004;桂林电子科技大学广西光电信息处理重点实验室培育基地 广西桂林 541004
文献出处:
引用格式:
[1]黄旺辉;冯永;强保华;裴钰璇;罗越-.SiamCross:孪生交叉的目标跟踪对象感知网络)[J].计算机学报,2022(10):2151-2166
A类:
SiamCross,Obejct,OAIN,ADCA
B类:
对象感,感知网络,近来,法因,保持良好,视觉跟踪,孪生网络,乏信息,信息交互,模型性能,协作能力,Siamese,Object,Aware,Network,双分支,语义背景,依赖模型,子网络,SCAN,高效协同,协同工作,上下文语义,语义信息,区分性,模板特征,主动学习,锚框算法,像素,自聚焦,空间信息,互补性,特征学习,背景信息,中心定位,定位信息,信息表达,所在区域,空间特征,特征信息,力交互,交互网络,Attention,Interaction,交叉注意力,注意力模块,Parallel,Module,Adaptive,Deformable,Align,中局,全局信息,目标状态估计,目标区域,特征对齐,失焦,考信,信源,大幅度降低,模块设计,空间转换,无锚框网络,交互机制,OTB2015,VOT2018,GOT,10k,LaSOT,详尽,实验评估,跟踪器,SiamRPN++,ATOM,DiMP,综合表现,实时跟踪,视觉目标跟踪
AB值:
0.429508
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。