首站-论文投稿智能助手
典型文献
视频描述中链式语义生成网络
文献摘要:
针对视频描述中语义特征表达能力不足导致文本描述不准确问题,本文提出一种视频描述中链式语义生成网络(Chained Semantic generation Network,ChainS-Net).构建了多阶段双路交叉的链式特征提取结构,该结构以全局域和局部域模块为基本单元,分别从视觉特征的全局和局部捕获视频语义;在网络的各阶段,将语义信息在全局域和局部域之间变换解析,实现视觉和语义信息的交互参考,提升语义特征表达能力;在此基础上,网络通过多阶段迭代的处理方式获取更为有效的语义表示,提升视频描述模型性能.在MSR-VTT和MSVD数据集上的实验结果表明,本文提出的链式语义生成网络ChainS-Net优于现有同类方法,相比于语义辅助视频描述网络(Semantics-Assisted Video Captioning network,SA VC),视频描述的四个评价指标平均提升了 2.5%.
文献关键词:
视频描述;语义特征;全局;局部;域变换;多阶段
作者姓名:
毛琳;高航;杨大伟;张汝波
作者机构:
大连民族大学机电工程学院,辽宁大连116600
文献出处:
引用格式:
[1]毛琳;高航;杨大伟;张汝波-.视频描述中链式语义生成网络)[J].光学精密工程,2022(24):3198-3209
A类:
Chained,ChainS
B类:
视频描述,语义生成,生成网络,对视,语义特征,特征表达,表达能力,文本描述,generation,Network,多阶段,双路,局域,局部域,基本单元,视觉特征,语义信息,描述模型,模型性能,MSR,VTT,MSVD,语义辅助,Semantics,Assisted,Video,Captioning,network,SA,VC,四个评价,域变换
AB值:
0.390568
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。