结合关键帧提取的视频-文本跨模态实体分辨双重编码方法|曾志贤;曹建军;翁年凤;蒋国权;范强|国防科技大学第六十三研究所,江苏南京210007 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

结合关键帧提取的视频-文本跨模态实体分辨双重编码方法

文献摘要：

现有的视频-文本跨模态实体分辨方法在视频处理上均采用均匀取帧的方法,必然导致视频信息的丢失,增加问题的复杂度.针对这一问题,提出一种结合关键帧提取的视频-文本跨模态实体分辨双重编码方法(DEIKFE).以充分保留视频信息表征为前提,设计关键帧提取算法提取视频中的关键帧,获得视频关键帧集合表示.对于视频关键帧集合和文本,采用多级编码的方法,分别提取表征视频和文本的全局、局部和时序的特征,将其进行拼接形成多级编码表示.将该编码表示映射至共同嵌入空间,采用强负样本跨模态三元组损失对模型参数进行优化,使得匹配的视频-文本相似度越大,而不匹配的视频-文本相似度越小.通过在MSR-VTT、VATEX两个数据集上进行实验验证,与现有方法进行对比,在总体性能R@sum上分别提升了9.22％、2.86％,证明了该方法的优越性.

文献关键词：

跨模态实体分辨;关键帧提取;共同嵌入空间;双重编码;强负样本

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

作者姓名：

曾志贤;曹建军;翁年凤;蒋国权;范强

作者机构：

国防科技大学计算机学院,湖南长沙410003;国防科技大学第六十三研究所,江苏南京210007

文献出处：

引用格式：

[1]曾志贤;曹建军;翁年凤;蒋国权;范强-.结合关键帧提取的视频-文本跨模态实体分辨双重编码方法)[J].兵工学报,2022(05):1107-1116

A类：

跨模态实体分辨,DEIKFE,共同嵌入空间,强负样本,VATEX

B类：

关键帧提取,双重编码,编码方法,视频处理,视频信息,分保,信息表征,视频关键帧,多级编码,提取表征,拼接,编码表示,三元组损失,文本相似度,MSR,VTT,总体性能,sum

AB值：

0.200568

相似文献

基于改进AlexNet的可变形卷积皮肤病变识别算法

李海燕;马艳;李海江;郭磊;李红松-云南大学信息学院,云南, 昆明 650050;云南交通投资建设集团有限公司,云南, 昆明 650000

基于孪生神经网络的行文一致性测评研究

刘杰;张文轩;李亚光;张逸超;周建设-首都师范大学信息工程学院,北京 100048;北方工业大学信息工程学院,北京 100144;首都师范大学中国语言智能研究中心,北京 100048

一种融合关系抽取的推荐系统

高春晓;卢士帅;刘琼昕;宋祥-北京理工大学北京市海量语言信息处理与云计算应用工程技术研究中心,北京 100081;北京理工大学计算机学院,北京 100081

基于核相关滤波的视频卫星目标跟踪算法

刘耀胜;廖育荣;林存宝;李兆铭;倪淑燕-航天工程大学,北京 101400

基于跨域关系学习的视频分割算法研究

龚猷龙-重庆广播电视大学电子信息工程学院,重庆 401520

基于位平面分块编码的可逆信息隐藏方法

顼聪;刘朝霞;陶永鹏;景雨-大连外国语大学软件学院,辽宁大连 116044;大连外国语大学语言智能研究中心,辽宁大连 116044

基于可变形卷积的侦察视频增强方法

赵彦杰;崔海斌;陈振;谌德荣;宫久路-北京理工大学,北京100081;中国人民解放军91515部队,海南三亚572099

基于卷积降噪自编码器的雷达信号智能分选

洪淑婕;孙闽红;王之腾;仇兆炀-杭州电子科技大学通信工程学院,浙江杭州310018;陆军工程大学通信工程学院,江苏南京210001

用于场景分割的改进DeepLabV3+算法

桑永龙;韩军-上海大学通信与信息工程学院,上海 200000;上海先进通信与数据科学研究院,上海 200000

基于剖分网格改进A算法的航迹规划研究

陈晓宏;储飞黄;方胜良;马昭-航天工程大学,北京 101000

融合多特征的时空正则化相关滤波无人机跟踪

张微-宝鸡文理学院计算机学院,陕西宝鸡 721000

基于双流残差网络的视频异常事件检测研究

王梓旭;金立左;张珊;苏国伟;陈瑞杰-东南大学,南京 210000;西安电子科技大学,西安 710000

基于改进EDSR的轻量化机载图像超分辨率算法

王辰北;张海军;王浩然-中国航空工业集团公司洛阳电光设备研究所,河南洛阳 471000;光电控制技术重点实验室,河南洛阳 471000

激光选区熔化熔池视频监测与评价

彭浩;高椿明;张萍;张凯;张长东;刘婷婷-电子科技大学光电科学与工程学院,成都 610054;南京理工大学机械工程学院,南京 210094

基于光电转台全局运动补偿与YOLOv3网络模型的运动目标检测算法

马志扬;傅慧妮;赵博;杨忠琳;姜雨彤;朱梦琪;孙伟琛;李兴鑫-中国北方车辆研究所,北京100072

考虑阻尼和行星传动齿轮啮合刚度的动力传动系统动态特性

康忠;李振平;阮新建;杨志勇;徐中一-中国北方车辆研究所, 北京100072

基于视频识别的飞行训练考核评估方法

邢宝峻;殷哲;王卫星;彭晓明-空军预警学院武汉 430019

基于融合数据关联的无人机多目标跟踪算法

周嘉麒;王指辉;廖万斌-南京航空航天大学南京 211106

基于嵌入式GPU的相关滤波跟踪算法改进及实现

徐卓;康隽睿;袁博;韩冬艳;党清新-西安现代控制技术研究所,西安 710065;西安科技大学管理学院,西安 710065

基于轻量级多尺度注意力U-Net的遥感图像飞机检测方法

张善文;齐国红;徐新华-郑州西亚斯学院电子信息工程学院,郑州 451150

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。