首站-论文投稿智能助手
典型文献
基于视觉特征引导融合的视频描述方法
文献摘要:
视频描述生成因其广泛的潜在应用场景而成为近年来的研究热点之一.针对模型解码过程中视觉特征和文本特征交互不足而导致描述中出现识别错误的情况,提出基于编解码框架下的视觉与文本特征交互增强的多特征融合视频描述方法.在解码过程中,该方法使用视觉特征辅助引导描述生成,不仅为每一步的生成过程提供了文本信息,同时还提供了视觉参考信息,引导其生成更准确的词,大幅度提升了模型产生的描述质量;同时,结合循环dropout缓解解码器存在的过拟合情况,进一步提升了评价分数.在该领域广泛使用的MSVD和MSRVTT数据集上的消融和对比实验结果证明,提出的方法的可以有效生成视频描述,综合指标分别增长了17.2和2.1个百分点.
文献关键词:
编解码框架;视频描述;特征融合;dropout;特征交互
作者姓名:
苗教伟;季怡;刘纯平
作者机构:
苏州大学 计算机科学与技术学院,江苏 苏州 215006
引用格式:
[1]苗教伟;季怡;刘纯平-.基于视觉特征引导融合的视频描述方法)[J].计算机工程与应用,2022(20):124-131
A类:
MSRVTT
B类:
视觉特征,特征引导,视频描述,潜在应用,中视,文本特征,特征交互,互不,编解码框架,多特征融合,特征辅助,生成过程,文本信息,考信,dropout,解解,解码器,过拟合,MSVD,融和,有效生成,综合指标,百分点
AB值:
0.370303
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。