从视频到语言:视频标题生成与描述研究综述|汤鹏杰;王瀚漓|同济大学计算机科学与技术系上海201804 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

从视频到语言:视频标题生成与描述研究综述

文献摘要：

视频标题生成与描述是使用自然语言对视频进行总结与重新表达.由于视频与语言之间存在异构特性,其数据处理过程较为复杂.本文主要对基于"编码-解码"架构的模型做了详细阐述,以视频特征编码与使用方式为依据,将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法,并对各类模型进行了归纳与总结.最后,对当前存在的问题及可能趋势进行了总结与展望,指出需要生成融合情感、逻辑等信息的结构化语段,并在模型优化、数据集构建、评价指标等方面进行更为深入的研究.

文献关键词：

视频描述;卷积神经网络;循环神经网络;语段生成;情感表达;逻辑语义

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[3] 语言、文字（H） / 语言学（H0） / 语义学、语用学、词汇学、词义学（H03） / 语义学、语用学（H030）

作者姓名：

汤鹏杰;王瀚漓

作者机构：

井冈山大学电子与信息工程学院吉安343009;同济大学计算机科学与技术系上海201804;嵌入式系统与服务计算教育部重点实验室(同济大学) 上海200092;同济大学上海智能科学与技术研究院上海200092

文献出处：

自动化学报

引用格式：

[1]汤鹏杰;王瀚漓-.从视频到语言:视频标题生成与描述研究综述)[J].自动化学报,2022(02):375-397

A类：

语段生成

B类：

标题,自然语言,对视,解码,特征编码,使用方式,视觉特征,视频序列,列记,三维卷积,卷积特征,混合方法,总结与展望,模型优化,数据集构建,视频描述,循环神经网络,情感表达,逻辑语义

AB值：

0.454487

相似文献

图神经网络综述

马帅;刘建伟;左信-中国石油大学(北京)信息科学与工程学院北京102249

面向视频中人体行为识别的复合型深度神经网络

黄敏;尚瑞欣;钱惠敏-河海大学能源与电气学院南京211100

基于Vision Transformer的中文唇语识别

薛峰;洪自坤;李书杰;李雨;谢胤岑-合肥工业大学软件学院合肥230601;合肥工业大学计算机与信息学院合肥230601

光流与纹理特征融合的人脸活体检测算法

王宏飞;程鑫;赵祥模;周经美-长安大学信息工程学院,西安 710064;长安大学电子与控制工程学院,西安 710064

基于深度学习的文本到图像生成方法综述

王宇昊;何彧;王铸-贵州天衍炬恒科技有限公司,贵阳 550081;北京大学地球与空间科学学院,北京 100871;贵州师范大学地理与环境科学学院,贵阳 550025

人群计数研究综述

卢振坤;刘胜;钟乐;刘绍航;张甜-广西民族大学电子信息学院,南宁 530000

基于背景建模的VideoSAR动目标阴影检测方法

王鑫;田甜;田金文-华中科技大学人工智能与自动化学院,湖北武汉 430074;华中科技大学多谱信息处理技术国家级重点实验室,湖北武汉 430074

基于深度学习的视频超分辨率重构进展综述

冷佳旭;王佳;莫梦竟成;陈泰岳;高新波-重庆邮电大学图像认知重庆市重点实验室重庆400065;南京理工大学江苏省社会安全图像与视频理解重点实验室南京210094

多层注意力机制融合的序列到序列中国连续手语识别和翻译

周乐员;张剑华;袁甜甜;陈胜勇-天津理工大学计算机科学与工程学院天津300382;天津理工大学聋人工学院天津300382

多关键帧特征交互的人脸篡改视频检测

祝恺蔓;徐文博;卢伟;赵险峰-中山大学计算机学院, 广州 510006;中国科学院信息工程研究所信息安全国家重点实验室, 北京 100195;中国科学院大学网络空间安全学院, 北京 100195

融合时空域特征的人脸表情识别

陈拓;邢帅;杨文武;金剑秋-浙江工商大学计算机与信息工程学院,杭州 310018

图网络层级信息挖掘分类算法综述

魏文超;蔺广逢;廖开阳;康晓兵;赵凡-西安理工大学印刷包装与数字媒体学院,西安 710048

融合通道层注意力机制的多支路卷积网络抑郁症识别

孙浩浩;邵珠宏;尚媛园;孙晓妮;胡强;孔佑勇-首都师范大学信息工程学院,北京 100048;上海交通大学医学院附属精神卫生中心,上海 200030;上海交通大学生物医学工程学院,上海 200240;东南大学计算机科学与工程学院,南京 210096

类别敏感的全局时序关联视频动作检测

王东祺;赵旭-上海交通大学自动化系,上海 200240

人类动作识别的特征提取方法综述

彭月;甘臣权;张祖凡-重庆邮电大学通信与信息工程学院重庆 400065

基于改进注意力网络的转炉炼钢状态判别

贺雨霞;曹国-南京理工大学计算机科学与工程学院,江苏南京 210094

基于文本挖掘的弹幕情绪分析研究

江涛;黄昌昊;孙斌-西北民族大学中国民族语言文学信息技术教育部重点实验室,兰州730030

基于深度学习的人体行为识别综述

邓淼磊;高振东;李磊;陈斯-河南工业大学信息科学与工程学院,郑州 450001

基于视觉特征引导融合的视频描述方法

苗教伟;季怡;刘纯平-苏州大学计算机科学与技术学院,江苏苏州 215006

基于注意力机制和编码-解码架构的施工场景图像描述方法

农元君;王俊杰;陈红;孙文涵;耿慧;李书悦-中国海洋大学工程学院,山东青岛 266100

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。