首站-论文投稿智能助手
典型文献
融合时空切片和双注意力机制的视频摘要方法
文献摘要:
为解决现有视频摘要方法的视频帧特征信息提取不充分、摘要结果过分依赖单一特征的问题,提出了一种融合时空切片和双注意力机制的视频摘要方法.在原视频的精准分段阶段,提出了基于时空切片的核时序分割算法(STS-KTS),将视频场景信息反映为时空切片纹理信息,采用水平映射法将预处理后的时空切片投影为一维数组,作为KTS的输入特征;以双注意力机制和分组卷积为基本组件,结合BiLSTM构建时空特征提取网络,以快速提取丰富的时空特征信息,从而配合纹理特征信息消除现有摘要模型对单一特征的过分依赖;采用帧参数预测模块获取最佳的视频帧贡献度分数、中心度分数以及帧序列位置;将帧分数转化为镜头分数,以选取内容丰富的片段,进而生成动态视频摘要.在SumMe和TVSum数据集上的实验表明:所提方法能提高生成摘要的准确性,比现有方法性能更高,尤其在SumMe数据集上的生成摘要准确性相比于现有方法提升了0.58%.
文献关键词:
视频摘要;时空切片;双注意力机制;时空特征提取;深度学习
作者姓名:
张云佐;郭亚宁;李文博
作者机构:
石家庄铁道大学信息科学与技术学院,050043,石家庄
引用格式:
[1]张云佐;郭亚宁;李文博-.融合时空切片和双注意力机制的视频摘要方法)[J].西安交通大学学报,2022(12):127-135
A类:
SumMe,TVSum
B类:
时空切片,双注意力机制,视频摘要,视频帧,特征信息提取,分段阶段,分割算法,STS,KTS,纹理信息,射法,数组,输入特征,分组卷积,BiLSTM,时空特征提取,特征提取网络,快速提取,纹理特征,参数预测,贡献度,中心度,序列位置,镜头,内容丰富
AB值:
0.257524
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。