典型文献
多模态特征融合的视频记忆度预测
文献摘要:
随着网络视频的爆炸式增长,视频记忆度成为热点研究方向.视频记忆度是衡量一个视频令人难忘的程度指标,设计自动预测视频记忆度的计算模型有广泛的应用和前景.当前对视频记忆度预测的研究多集中于普遍的视觉特征或语义因素,没有考虑深度特征对视频记忆度的影响.着重探索了视频的深度特征,在视频预处理后利用现有的深度估计模型提取深度图,将视频原始图像和深度图一起输入预训练的ResNet152网络来提取深度特征;使用TF-IDF算法提取视频的语义特征,并对视频记忆度有影响的单词赋予不同的权重;将深度特征、语义特征和从视频内容中提取的C3D时空特征进行后期融合,提出了一个融合多模态的视频记忆度预测模型.在MediaEval 2019会议提供的大型公开数据集(VideoMem)上进行实验,在视频的短期记忆度预测任务中达到了0.545(长期记忆度预测任务:0.240)的Spearman相关性,证明了该模型的有效性.
文献关键词:
视频记忆度;多模态;特征融合
中图分类号:
作者姓名:
常诗颖;胡燕
作者机构:
武汉理工大学 计算机科学与技术学院,武汉 430070
文献出处:
引用格式:
[1]常诗颖;胡燕-.多模态特征融合的视频记忆度预测)[J].计算机工程与应用,2022(14):219-226
A类:
视频记忆度,MediaEval,VideoMem
B类:
多模态特征融合,网络视频,爆炸式,热点研究,令人难忘,自动预测,对视,多集,视觉特征,深度特征,视频预处理,深度估计,深度图,原始图像,预训练,ResNet152,TF,IDF,语义特征,单词,词赋,视频内容,C3D,时空特征,公开数据集,短期记忆,中达,长期记忆
AB值:
0.28067
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。