首站-论文投稿智能助手
典型文献
端到端增强卷积网络的视频人脸表情识别研究
文献摘要:
视频人脸表情识别在无人驾驶、智慧医疗等多领域都有广泛应用.针对视频单帧特征提取存在信息损失的问题,提出单帧增强卷积网络,该网络采用浅层特征与深层特征融合实现特征增强,其中浅层特征为CNN中间层外延卷积模块实现浅层特征提取,深层特征为CNN网络最后一层融合空洞卷积和基于通道间注意力机制,实现特征通道重定位和强弱信息结合.又由于视频相邻帧存在相关性,提出多帧增强卷积网络,其采用帧间注意力机制,根据视频帧之间的相关性给视频帧打分从而得到视频的关键帧,继而实现多帧特征增强.最后对设计的模型在AFEW数据集、CK+数据集、SFEW数据集、FER数据集上进行验证,其中AFEW数据集上对视频表情识别的准确率从40.00%提升到45.19%,F1分数从0.31提升到0.3937.该网络模型不仅能应用于静态图像,而且能应用于动态视频,同时也能提高表情识别准确率,降低误差,从而提升识别效率.
文献关键词:
表情识别;单帧增强卷积网络;注意力机制;多帧增强卷积网络;AFEW数据集
作者姓名:
唐武宾;童莹;曹雪虹
作者机构:
南京邮电大学通信与信息工程学院,江苏南京210003;南京工程学院信息与通信工程学院,江苏南京211167
文献出处:
引用格式:
[1]唐武宾;童莹;曹雪虹-.端到端增强卷积网络的视频人脸表情识别研究)[J].软件导刊,2022(03):42-48
A类:
单帧增强卷积网络,多帧增强卷积网络,AFEW
B类:
端到端,人脸表情识别,无人驾驶,智慧医疗,对视,信息损失,深层特征,特征融合,特征增强,中浅层,中间层,卷积模块,空洞卷积,通道间注意力,注意力机制,重定位,信息结合,视频帧,打分,关键帧,CK+,SFEW,FER,于静,识别准确率,降低误差
AB值:
0.281949
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。