典型文献
基于2D CNN和Transformer的人体动作识别
文献摘要:
人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义.为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2DCNN相结合用于人体动作识别,以更好地捕获上下文时间信息.首先使用融合通道-空间注意力模块的2D CNN提取强化的帧内空间特征,其次利用Transformer捕捉帧间的时间特征,最后应用MLP Head进行动作分类.实验结果表明在HMDB-51数据集和UCF-101数据集上分别达到了 69.4%和95.5%的识别准确度.
文献关键词:
人体动作识别;2D CNN;通道-空间注意力模块;Transformer
中图分类号:
作者姓名:
朱相华;智敏;殷雁君
作者机构:
内蒙古师范大学计算机科学技术学院 呼和浩特010022
文献出处:
引用格式:
[1]朱相华;智敏;殷雁君-.基于2D CNN和Transformer的人体动作识别)[J].电子测量技术,2022(15):123-129
A类:
B类:
Transformer,人体动作识别,计算机视觉,人机交互,视频监控,研究意义,模长,依赖关系,系上,2DCNN,上下文,时间信息,合通,空间注意力,注意力模块,空间特征,时间特征,MLP,Head,动作分类,HMDB,UCF
AB值:
0.412941
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。