典型文献
极化自注意力调控的情景式视频实例多尺度分割
文献摘要:
视频实例分割(Video Instance Segmentation)是开发智能机器人视觉系统的一项关键技术,部署视频实例分割算法的智能机器人能够精确地实现目标追踪、避障等高复杂度任务.机器人在特定情景下自主移动时的成像效果会受到自身速度、拍摄角度、距离远近及目标移动速度的影响,导致捕获的运动目标普遍存在拓扑形变和尺度缩放等随机性问题.对于在相同视频序列中跨静态帧的同一目标实例而言,模型所学习的可辨识特征往往具有多样性和不确定性.现有模型更多强调帧间掩膜传播或特征跟踪等时序交互方法,而忽略了对拓扑实例的深层语义解析和尺度目标的轮廓分辨,因此缺乏对高层细粒度特征的有效关注和低层空间信息的准确定位.本文提出一种极化自注意力调控的多尺度视频实例分割PSAM-Net(Polarized Self-Attention Manipulation Network)模型.首先,在残差网络中嵌入单级式和级联式的极化自注意力机制,以建立任意空间位置的非线性关联信息,及其正交方向的通道特征依赖关系,克服高层特征图中细粒度特征分布弥散问题,增强模型的区域特征聚焦能力,完成对拓扑实例的深层语义解析;其次,由特征金字塔自上而下的特征流动方式,所导致的低层特征空间位置和实例边缘信息匮乏问题,对聚合了多粒度信息的空间定位分支模型进行构建,以适应不同尺度下前景目标定位检测和轮廓分割需求.最后,从Youtube-VIS中划分出多个适用于动物场景下的数据集.交叉验证结果表明,相较于YolactEdge基准模型,PSAM-Net在平均检测和平均分割精度上分别提升6.08%和8.87%,达到44.06%和44.41%,测试速度高达80FPS,表现出较好的鲁棒性与稳定性.本文方法实现了视频序列输入下的实时高精度分割,为智能移动机器人的自主环境感知提供了有效理论依据和一定参考价值.
文献关键词:
视频实例分割;拓扑形变;尺度缩放;PSAM-Net;极化自注意力调控;空间定位分支
中图分类号:
作者姓名:
黄滢;何自芬;杨宏宽;赵崇任;张印辉
作者机构:
昆明理工大学机电工程学院 昆明 650500
文献出处:
引用格式:
[1]黄滢;何自芬;杨宏宽;赵崇任;张印辉-.极化自注意力调控的情景式视频实例多尺度分割)[J].计算机学报,2022(12):2605-2618
A类:
极化自注意力调控,视频实例分割,拓扑形变,空间定位分支,YolactEdge,80FPS
B类:
情景式,多尺度分割,Video,Instance,Segmentation,智能机器人,机器人视觉系统,分割算法,实现目标,目标追踪,避障,定情,下自,成像效果,拍摄角度,距离远,远近,移动速度,运动目标,尺度缩放,随机性,视频序列,中跨,所学,可辨,辨识特征,现有模型,掩膜,特征跟踪,交互方法,深层语义,语义解析,细粒度特征,低层,层空间,空间信息,准确定位,PSAM,Polarized,Self,Attention,Manipulation,Network,残差网络,单级式,级联式,自注意力机制,空间位置,非线性关联,联信,通道特征,依赖关系,特征图,特征分布,弥散,增强模型,区域特征,特征金字塔,特征流,流动方式,特征空间,边缘信息,多粒度信息,支模,不同尺度,目标定位,定位检测,Youtube,VIS,分出,交叉验证,平均分,测试速度,智能移动机器人,主环,环境感知
AB值:
0.386912
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。