首站-论文投稿智能助手
典型文献
基于多层聚焦Inception-V3卷积网络的细粒度图像分类
文献摘要:
细粒度图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,准确地定位与提取判别性局部特征至关重要.本文提出一种多层聚焦卷积网络,通过首层聚焦网络能够准确、有效地聚焦于识别局域并生成定位区域,根据定位区域对原图像分别进行裁剪和遮挡后输入下一层的聚焦网络进行训练分类.其中单层聚焦网络以In-ception-V3网络为基础,通过卷积块特征注意力模块和定位区域选择机制来聚焦有效的定位区域;使用双线性注意力最大池化提取各个局部的特征;最后进行分类预测.本文在3个常用的细粒度数据集CUB-2011、FGVC-Aircraft以及Stanford Cars上进行了实验验证,分别获得了89.7%、93.6%和95.1%的Top-1准确率.实验结果表明,本模型的分类准确率高于目前主流方法.
文献关键词:
多层聚焦卷积网络;Inception-V3网络;注意力机制;双线性注意力最大池化
作者姓名:
王波;黄冕;刘利军;黄青松;单文琦
作者机构:
昆明理工大学信息工程与自动化学院,云南昆明650500;云南国土资源职业学院信息中心,云南昆明652501;云南大学信息学院,云南昆明650091;云南省计算机技术应用重点实验室,云南昆明650500
文献出处:
引用格式:
[1]王波;黄冕;刘利军;黄青松;单文琦-.基于多层聚焦Inception-V3卷积网络的细粒度图像分类)[J].电子学报,2022(01):72-78
A类:
多层聚焦卷积网络,双线性注意力最大池化
B类:
Inception,V3,细粒度图像分类,背景干扰,类间差异小,类内差异,判别性,局部特征,首层,别局,局域,原图,裁剪,遮挡,特征注意力模块,区域选择,选择机制,分类预测,CUB,FGVC,Aircraft,Stanford,Cars,Top,分类准确率,主流方法,注意力机制
AB值:
0.377332
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。