基于显著性特征提取的图像描述算法|王鑫;宋永红;张元林|西安交通大学人工智能学院西安710049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于显著性特征提取的图像描述算法

文献摘要：

图像描述(Image captioning)是一个融合了计算机视觉和自然语言处理这两个领域的研究方向,本文为图像描述设计了一种新颖的显著性特征提取机制(Salient feature extraction mechanism,SFEM),能够在语言模型预测每一个单词之前快速地向语言模型提供最有价值的视觉特征来指导单词预测,有效解决了现有方法对视觉特征选择不准确以及时间性能不理想的问题.SFEM包含全局显著性特征提取器和即时显著性特征提取器这两个部分:全局显著性特征提取器能够从多个局部视觉向量中提取出显著性视觉特征,并整合这些特征到全局显著性视觉向量中;即时显著性特征提取器能够根据语言模型的需要,从全局显著性视觉向量中提取出预测每一个单词所需的显著性视觉特征.本文在MS COCO(Mi-crosoft common objects in context)数据集上对SFEM进行了评估,实验结果表明SFEM能够显著提升基准模型(baseline)生成图像描述的准确性,并且SFEM在生成图像描述的准确性方面明显优于广泛使用的空间注意力模型,在时间性能上也大幅领先空间注意力模型.

文献关键词：

图像描述;显著性特征提取;语言模型;编码器;解码器

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[2] 无线电电子学、电信技术（TN） / 通信（TN91） / 通信理论（TN911） / 信号处理（TN911.7） / 图像信号处理（TN911.73）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

作者姓名：

王鑫;宋永红;张元林

作者机构：

西安交通大学软件学院西安710049;西安交通大学人工智能学院西安710049

文献出处：

自动化学报

引用格式：

[1]王鑫;宋永红;张元林-.基于显著性特征提取的图像描述算法)[J].自动化学报,2022(03):735-746

A类：

B类：

显著性特征提取,图像描述,Image,captioning,计算机视觉,自然语言处理,Salient,feature,extraction,mechanism,SFEM,语言模型,单词,视觉特征,对视,特征选择,时间性能,征到,COCO,Mi,crosoft,common,objects,context,baseline,成图,空间注意力模型,编码器,解码器

AB值：

0.27497

相似文献

基于差异双分支编码器的多阶段图像融合方法

洪雨露;吴小俊;徐天阳-江南大学人工智能与计算机学院江苏省模式识别与计算智能工程实验室无锡214122

基于Vision Transformer的中文唇语识别

薛峰;洪自坤;李书杰;李雨;谢胤岑-合肥工业大学软件学院合肥230601;合肥工业大学计算机与信息学院合肥230601

基于非对称双路识别网络的步态识别方法

周潇涵;王修晖-中国计量大学信息工程学院,浙江省电磁波信息技术与计量检测重点实验室,杭州 310018

基于空间和多层级联合编码的图像描述算法

方仲俊;张静;李冬冬-华东理工大学信息科学与工程学院上海200237;苏州大学江苏省计算机信息处理技术重点实验室江苏苏州215031

基于粒度感知和语义聚合的图像-文本检索网络