首站-论文投稿智能助手
典型文献
基于动态时序移位的视频特征学习方法
文献摘要:
视频动作识别旨在分类不同视频片段中的动作,而一个视频片段中的动作连续存在于整个时间维度,因此对连续动作所包含的时序特征进行学习是视频动作识别任务中的一个重要方向.现有方法主要通过更多的卷积操作学习时序特征,获取视频动作时序信息的同时增加了模型的复杂度和计算量;而时序移位操作则通过沿时间维度对通道特征进行移位实现时序信息的建模,减少了计算量,但只考虑了低层次通道的时序特征学习,缺乏通道选择的依据,且忽略了时序移位对整个时空特征结构的影响.为此,提出基于动态时序移位(Dynamic Temporal Shift,DTS)的视频特征学习方法.首先,利用双层全连接神经网络学习不同层次通道上多个时间维度特征间的相关性,获得整个通道的注意力分布,并固定双层全连接神经网络的参数用于保存全局特征信息.然后,设计DTS模块,依据通道的注意力分布动态选择通道进行移位.此外,为消除时间维度上特征的移位对全局时空特征结构的影响,利用全局信息进一步学习全局时空特征(Global Spatiotemporal Feature).在UCF101和Something-something v2公开数据集上取得较好的识别效果,验证了方法的有效性.
文献关键词:
视频动作识别;全连接神经网络;时序特征学习;动态时序移位;全局时空特征学习
作者姓名:
谈伟峰;程春玲;毛毅
作者机构:
南京邮电大学 计算机学院、软件学院、网络空间安全学院,江苏 南京 210023
引用格式:
[1]谈伟峰;程春玲;毛毅-.基于动态时序移位的视频特征学习方法)[J].计算机技术与发展,2022(12):43-49
A类:
动态时序移位,时序特征学习,全局时空特征学习
B类:
视频动作识别,续存,时间维度,卷积操作,操作学习,动作时序,时序信息,计算量,位操作,通道特征,低层次,通道选择,特征结构,Dynamic,Temporal,Shift,DTS,全连接神经网络,神经网络学习,不同层次,维度特征,注意力分布,全局特征,特征信息,分布动态,动态选择,全局信息,Global,Spatiotemporal,Feature,UCF101,Something,something,v2,公开数据集
AB值:
0.313404
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。