视频描述中链式语义生成网络|毛琳;高航;杨大伟;张汝波 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

视频描述中链式语义生成网络

文献摘要：

针对视频描述中语义特征表达能力不足导致文本描述不准确问题,本文提出一种视频描述中链式语义生成网络(Chained Semantic generation Network,ChainS-Net).构建了多阶段双路交叉的链式特征提取结构,该结构以全局域和局部域模块为基本单元,分别从视觉特征的全局和局部捕获视频语义;在网络的各阶段,将语义信息在全局域和局部域之间变换解析,实现视觉和语义信息的交互参考,提升语义特征表达能力;在此基础上,网络通过多阶段迭代的处理方式获取更为有效的语义表示,提升视频描述模型性能.在MSR-VTT和MSVD数据集上的实验结果表明,本文提出的链式语义生成网络ChainS-Net优于现有同类方法,相比于语义辅助视频描述网络(Semantics-Assisted Video Captioning network,SA VC),视频描述的四个评价指标平均提升了 2.5％.

文献关键词：

视频描述;语义特征;全局;局部;域变换;多阶段

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

毛琳;高航;杨大伟;张汝波

作者机构：

大连民族大学机电工程学院,辽宁大连116600

文献出处：

光学精密工程

引用格式：

[1]毛琳;高航;杨大伟;张汝波-.视频描述中链式语义生成网络)[J].光学精密工程,2022(24):3198-3209

A类：

Chained,ChainS

B类：

视频描述,语义生成,生成网络,对视,语义特征,特征表达,表达能力,文本描述,generation,Network,多阶段,双路,局域,局部域,基本单元,视觉特征,语义信息,描述模型,模型性能,MSR,VTT,MSVD,语义辅助,Semantics,Assisted,Video,Captioning,network,SA,VC,四个评价,域变换

AB值：

0.390568

相似文献

高分辨率遥感影像建筑物提取的注意力胶囊网络算法

许正森;管海燕;彭代锋;于永涛;雷相达;赵好好-南京信息工程大学遥感与测绘工程学院,南京210044;淮阴工学院计算机与软件学院,淮安223003

三维人体重建中的服装视觉信息表示

普骏程;刘骊;付晓东;刘利军;黄青松-昆明理工大学信息工程与自动化学院昆明 650500;云南省计算机技术应用重点实验室昆明 650500

ZS3D-Net:面向三维模型的零样本分类网络

白静;袁涛;范有福-北方民族大学计算机科学与工程学院银川 750021;北方民族大学图像图形智能处理国家民委重点实验室银川 750021

基于循环残差卷积神经网络的医学图像分割算法

金燕;薛智中;姜智伟-浙江工业大学信息工程学院杭州 310023

融合笔画语义和注意力机制的汉字字体生成算法