基于注意力时空解耦3D卷积LSTM的视频预测|黄金贵;黄一举 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于注意力时空解耦3D卷积LSTM的视频预测

文献摘要：

为高效提取视频时空特征以提高视频预测准确性,提出了注意力时空解耦3D卷积LSTM算法.首先,将卷积LSTM内部单元的传统2D卷积运算改为3D卷积,额外提取视频帧间短期空间运动信息;并借助注意力机制自动捕捉视频帧间长期动态信息的相关性.其次,由于卷积LSTM网络中特征信息在所有层的Z型传递方式会导致梯度消失,为此在网络结构中加入层间高速通道优化不同层间LSTM单元视频信息流的传递过程.同时,时间特征和空间特征在网络中会彼此干扰学习冗余功能,造成特征信息的低效获取以及网络预测质量的降低,为此在损失函数中加入时空解耦运算分离时间特征和空间特征的学习.最后,针对训练编码阶段和预测解码阶段的数据输入过程,提出数据输入重采样,在模型训练和预测阶段使用相近相反的数据输入策略减少编码器和解码器的差异.在合成数据集以及人体动作数据库上的实验结果表明,该算法模型在时空特征提取上有更好的性能.

文献关键词：

视频预测;卷积LSTM;注意力机制;时空解耦;重采样

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

作者姓名：

黄金贵;黄一举

作者机构：

湖南师范大学信息科学与工程学院,湖南长沙410081

文献出处：

微电子学与计算机

引用格式：

[1]黄金贵;黄一举-.基于注意力时空解耦3D卷积LSTM的视频预测)[J].微电子学与计算机,2022(09):63-72

A类：

B类：

时空解耦,视频预测,高效提取,预测准确性,2D,卷积运算,视频帧,空间运动,运动信息,注意力机制,自动捕捉,动态信息,特征信息,传递方式,梯度消失,元视频,视频信息,信息流,传递过程,时间特征,空间特征,冗余功能,损失函数,分离时间,重采样,模型训练,编码器,解码器,合成数据集,作数,算法模型,时空特征提取

AB值：

0.37293

相似文献

结合Transformer与对称型编解码器的噪声虹膜图像分割方法

顾正杰;王财勇;田启川;张琪-北京建筑大学电气与信息工程学院北京 100044;北京建筑大学建筑大数据智能处理方法研究北京市重点实验室北京 100044;中国人民公安大学信息网络安全学院北京 100038

基于Vision Transformer的中文唇语识别

薛峰;洪自坤;李书杰;李雨;谢胤岑-合肥工业大学软件学院合肥230601;合肥工业大学计算机与信息学院合肥230601

融合TCN的时空域双流动态手势识别方法

罗标;陈勇-长江大学计算机科学学院,湖北荆州 434020

基于自注意力机制和时空特征的Tor网站流量分析模型

席荣康;蔡满春;芦天亮;李彦霖-中国人民公安大学信息网络安全学院,北京 100038

基于CNN_BiLSTM网络的入侵检测方法