首站-论文投稿智能助手
典型文献
用于动作识别的双流自适应注意力图卷积网络
文献摘要:
人体动作识别因在公共安全方面具有重要的作用而在计算机视觉领域备受关注.然而,现有的图卷积网络在融合多尺度节点的邻域特征时,通常采用各阶邻接矩阵直接相加的方法,各项重要性一致,难以聚焦于重要特征,不利于最优节点关系的建立,同时采用对不同模型的预测结果求平均的双流融合方法,忽略了潜在数据的分布差异,融合效果欠佳.为此,文中提出了一种双流自适应注意力图卷积网络,用于对人体动作进行识别.首先,设计了能自适应平衡权重的多阶邻接矩阵,使模型聚焦于更加重要的邻域;然后,设计了多尺度的时空自注意力模块及通道注意力模块,以增强模型的特征提取能力;最后,提出了一种双流融合网络,利用双流预测结果的数据分布来决定融合系数,提高融合效果.该算法在NTU RGB+D的跨主体和跨视角两个子数据集上的识别准确率分别达92.3%和97.5%,在Kinetics-Skeleton数据集上的识别准确率达39.8%,均高于已有算法,表明了文中算法对于人体动作识别的优越性.
文献关键词:
动作识别;图卷积网络;邻接矩阵;注意力;双流融合
作者姓名:
杜启亮;向照夷;田联房;余陆斌
作者机构:
华南理工大学 自动化科学与工程学院,广东 广州 510640;华南理工大学 中新国际联合研究院,广东 广州 510555;华南理工大学 自主系统与网络控制教育部重点实验室,广东 广州 510640;华南理工大学 珠海现代产业创新研究院,广东 珠海 519170
引用格式:
[1]杜启亮;向照夷;田联房;余陆斌-.用于动作识别的双流自适应注意力图卷积网络)[J].华南理工大学学报(自然科学版),2022(12):20-29
A类:
B类:
注意力图,图卷积网络,人体动作识别,公共安全,计算机视觉,邻域特征,邻接矩阵,相加,节点关系,双流融合,融合方法,分布差异,融合效果,多阶,自注意力模块,通道注意力模块,增强模型,特征提取能力,融合网络,数据分布,NTU,RGB+D,跨视角,识别准确率,Kinetics,Skeleton
AB值:
0.29097
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。