典型文献
结合特征融合和金字塔注意力的场景文本检测
文献摘要:
基于深度学习的场景文本检测普遍缺少特征级的精细化,导致原本设计良好的模型不能被充分利用,提出将特征融合和特征金字塔注意力模块应用到场景文本检测.将基本特征提取网络(PixelLink算法)得到的4个特征映射层以采样后加权叠加的方式进行特征融合,并将结果送给特征金字塔注意力模块.特征融合使各层级的特征信息相结合,从而增加了特征映射层的信息量.采用注意力网络可以在增大感受野的同时不提高计算力,而空间金字塔结构可利用不同的网格尺度或不同的扩张率融合多尺度的特征信息.特征金字塔注意力模块包含精细化金字塔网络分支、非线性变换分支以及全局平均池化分支.实验结果表明,相较于PixelLink算法,该算法在IC-DAR2015和ICDAR2013数据集上综合指标(F-measure,F)分别提升了2.91%和4.04%.
文献关键词:
特征融合;特征金字塔注意力模块;自然场景文本检测;PixelLink;ICDAR2015;ICDAR2013
中图分类号:
作者姓名:
冯宇静;贾世杰
作者机构:
大连交通大学 电气信息工程学院,辽宁 大连116028
文献出处:
引用格式:
[1]冯宇静;贾世杰-.结合特征融合和金字塔注意力的场景文本检测)[J].重庆邮电大学学报(自然科学版),2022(01):110-116
A类:
PixelLink
B类:
特征融合,特征金字塔注意力模块,到场,特征提取网络,特征映射,加权叠加,送给,特征信息,信息量,注意力网络,感受野,计算力,空间金字塔,金字塔结构,网格尺度,扩张率,金字塔网络,非线性变换,全局平均池化,ICDAR2013,综合指标,measure,自然场景文本检测,ICDAR2015
AB值:
0.252015
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。