典型文献
基于注意力时空解耦3D卷积LSTM的视频预测
文献摘要:
为高效提取视频时空特征以提高视频预测准确性,提出了注意力时空解耦3D卷积LSTM算法.首先,将卷积LSTM内部单元的传统2D卷积运算改为3D卷积,额外提取视频帧间短期空间运动信息;并借助注意力机制自动捕捉视频帧间长期动态信息的相关性.其次,由于卷积LSTM网络中特征信息在所有层的Z型传递方式会导致梯度消失,为此在网络结构中加入层间高速通道优化不同层间LSTM单元视频信息流的传递过程.同时,时间特征和空间特征在网络中会彼此干扰学习冗余功能,造成特征信息的低效获取以及网络预测质量的降低,为此在损失函数中加入时空解耦运算分离时间特征和空间特征的学习.最后,针对训练编码阶段和预测解码阶段的数据输入过程,提出数据输入重采样,在模型训练和预测阶段使用相近相反的数据输入策略减少编码器和解码器的差异.在合成数据集以及人体动作数据库上的实验结果表明,该算法模型在时空特征提取上有更好的性能.
文献关键词:
视频预测;卷积LSTM;注意力机制;时空解耦;重采样
中图分类号:
作者姓名:
黄金贵;黄一举
作者机构:
湖南师范大学信息科学与工程学院,湖南长沙410081
文献出处:
引用格式:
[1]黄金贵;黄一举-.基于注意力时空解耦3D卷积LSTM的视频预测)[J].微电子学与计算机,2022(09):63-72
A类:
B类:
时空解耦,视频预测,高效提取,预测准确性,2D,卷积运算,视频帧,空间运动,运动信息,注意力机制,自动捕捉,动态信息,特征信息,传递方式,梯度消失,元视频,视频信息,信息流,传递过程,时间特征,空间特征,冗余功能,损失函数,分离时间,重采样,模型训练,编码器,解码器,合成数据集,作数,算法模型,时空特征提取
AB值:
0.37293
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。