首站-论文投稿智能助手
典型文献
基于显著性特征提取的图像描述算法
文献摘要:
图像描述(Image captioning)是一个融合了计算机视觉和自然语言处理这两个领域的研究方向,本文为图像描述设计了一种新颖的显著性特征提取机制(Salient feature extraction mechanism,SFEM),能够在语言模型预测每一个单词之前快速地向语言模型提供最有价值的视觉特征来指导单词预测,有效解决了现有方法对视觉特征选择不准确以及时间性能不理想的问题.SFEM包含全局显著性特征提取器和即时显著性特征提取器这两个部分:全局显著性特征提取器能够从多个局部视觉向量中提取出显著性视觉特征,并整合这些特征到全局显著性视觉向量中;即时显著性特征提取器能够根据语言模型的需要,从全局显著性视觉向量中提取出预测每一个单词所需的显著性视觉特征.本文在MS COCO(Mi-crosoft common objects in context)数据集上对SFEM进行了评估,实验结果表明SFEM能够显著提升基准模型(baseline)生成图像描述的准确性,并且SFEM在生成图像描述的准确性方面明显优于广泛使用的空间注意力模型,在时间性能上也大幅领先空间注意力模型.
文献关键词:
图像描述;显著性特征提取;语言模型;编码器;解码器
作者姓名:
王鑫;宋永红;张元林
作者机构:
西安交通大学软件学院 西安710049;西安交通大学人工智能学院 西安710049
文献出处:
引用格式:
[1]王鑫;宋永红;张元林-.基于显著性特征提取的图像描述算法)[J].自动化学报,2022(03):735-746
A类:
B类:
显著性特征提取,图像描述,Image,captioning,计算机视觉,自然语言处理,Salient,feature,extraction,mechanism,SFEM,语言模型,单词,视觉特征,对视,特征选择,时间性能,征到,COCO,Mi,crosoft,common,objects,context,baseline,成图,空间注意力模型,编码器,解码器
AB值:
0.27497
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。