典型文献
基于分块注意力机制和交互位置关系的群组活动识别
文献摘要:
复杂场景下的群体活动识别是一项具有挑战性的任务,它涉及一组人在场景中的相互作用和相对空间位置关系.针对当前复杂场景下群组行为识别方法缺乏精细化设计以及没有充分利用个体间交互式特征的问题,提出了基于分块注意力机制和交互位置关系的网络框架,进一步考虑个体肢体语义特征,同时挖掘个体间交互特征相似性与行为一致性的关系.首先,采用原始视频序列和光流图像序列作为网络的输入,并引入一种分块注意力模块来细化个体的肢体运动特征;然后,将空间位置和交互式距离作为个体的交互特征;最后,将个体运动特征和空间位置关系特征融合为群体场景无向图的节点特征,并利用图卷积网络(GCN)进一步捕获全局场景下的活动交互,从而识别群体活动.实验结果表明,此框架在两个群组行为识别数据集(CAD和CAE)上分别取得了92.8%和97.7%的识别准确率,在CAD数据集上与成员关系图(ARG)和置信度能量循环网络(CERN)相比识别准确率分别提高了1.8个百分点和5.6个百分点,同时结合消融实验结果验证了所提算法有较高的识别精度.
文献关键词:
群组活动识别;注意力机制;交互关系;视频理解;图卷积网络
中图分类号:
作者姓名:
刘博;卿粼波;王正勇;刘美;姜雪
作者机构:
四川大学电子信息学院,成都610065
文献出处:
引用格式:
[1]刘博;卿粼波;王正勇;刘美;姜雪-.基于分块注意力机制和交互位置关系的群组活动识别)[J].计算机应用,2022(07):2052-2057
A类:
群组活动识别
B类:
分块,注意力机制,位置关系,复杂场景,群体活动,组人,相对空间位置,群组行为识别,精细化设计,交互式,网络框架,语义特征,交互特征,特征相似性,视频序列,光流,图像序列,列作,注意力模块,肢体运动,运动特征,关系特征,特征融合,节点特征,图卷积网络,GCN,别数,CAD,CAE,识别准确率,关系图,ARG,置信度,循环网络,CERN,百分点,消融实验,识别精度,交互关系,视频理解
AB值:
0.369585
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。