典型文献
双线性聚合残差注意力的细粒度图像分类模型
文献摘要:
针对细粒度图像分类任务中种类间局部信息差异性较小,通常会导致模型表征能力不足,特征通道之间的相互依赖关系较差以及无法有效捕捉到显著且多样化的特征信息等问题,提出了一种双线性聚合残差注意力网络(BARAN).首先在原双线性卷积网络模型(B-CNN)基础上,把原有特征提取子网络转变为更具学习能力的聚合残差网络,来提升网络的特征捕获能力;然后在每一聚合残差块内嵌入分散注意力模块,使得网络专注于整合跨维度特征,强化特征获取过程中通道之间的紧密关联程度;最终将融合的双线性特征图输入到互通道注意力模块中,利用互通道注意力模块包含的判别性与区分性两个子组件进一步学习到更加细微、多样化且互斥的局部类间易混淆信息.实验结果表明,该方法在CUB-200-2011、FGVC-Aircraft和Stanford Cars三个细粒度图像数据集上分类精度分别达到87.9%、92.9%、94.7%,性能优于大多数主流模型方法,并且相比原B-CNN模型提升幅度分别达到了0.038、0.088、0.034.
文献关键词:
细粒度图像分类;聚合残差;分散注意力;互通道注意力;多样化特征
中图分类号:
作者姓名:
李宽宽;刘立波
作者机构:
宁夏大学 信息工程学院,银川 750021
文献出处:
引用格式:
[1]李宽宽;刘立波-.双线性聚合残差注意力的细粒度图像分类模型)[J].计算机科学与探索,2022(04):938-949
A类:
BARAN,互通道注意力
B类:
双线性,聚合残差,细粒度图像分类,分类模型,分类任务,局部信息,息差,模型表征,表征能力,相互依赖,依赖关系,捕捉到,特征信息,残差注意力网络,线性卷积,卷积网络,子网络,残差网络,获能,残差块,内嵌,分散注意力,维度特征,关联程度,终将,线性特征,特征图,通道注意力模块,判别性,区分性,子组,加细,细微,互斥,部类,CUB,FGVC,Aircraft,Stanford,Cars,图像数据集,分类精度,流模型,模型方法,升幅,多样化特征
AB值:
0.362745
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。