首站-论文投稿智能助手
典型文献
注意力机制与复合卷积在手写识别中的应用
文献摘要:
将图片切分成单"字"识别再连接成"串"是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现.卷积循环神经网络(CRNN)虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,网络提取出的特征表示力不够.对此提出了加强型卷积块注意力模块和复合卷积,并将其加入处理脱机文本识别的CRNN+CTC主流框架中.加强型卷积块注意力模块增大输入特征图的贡献权重且并联地使用通道注意力、空间注意力,丰富了细化特征图语义信息的同时避免了通道注意力模块对空间注意力模块的权重干扰,使得网络更聚焦图片中的有用特征而非无用的拖拽字迹特征.而嵌入在网络深层的复合卷积采用的多卷积核卷积意味着不同尺度的特征融合,增强了网络的泛化性.基于加强型卷积块注意力模块和复合卷积的CRNN+CTC框架在具有语义信息的IAM数据集上准确率达到85.7748%,字符错误率为8.6%;在RIMES数据集上准确率达到92.8728%,字符错误率为3.9%,比起当前主流的脱机文本识别算法,性能进一步提升.
文献关键词:
脱机英文手写单词识别;加强型卷积块注意力模块;复合卷积;卷积循环神经网络(CRNN)
作者姓名:
卓天天;桑庆兵
作者机构:
江南大学 人工智能与计算机学院,江苏 无锡 214122
引用格式:
[1]卓天天;桑庆兵-.注意力机制与复合卷积在手写识别中的应用)[J].计算机科学与探索,2022(04):888-897
A类:
加强型卷积块注意力模块,CRNN+CTC,RIMES,脱机英文手写单词识别
B类:
注意力机制,复合卷积,手写识别,切分,成单,连接成,机手,图像识别,手写字符,粘连,卷积循环神经网络,整张,对齐,特征表示,文本识别,大输,输入特征,特征图,空间注意力,语义信息,通道注意力模块,无用,拖拽,字迹,多卷积核,不同尺度,特征融合,泛化性,IAM,错误率,比起,识别算法
AB值:
0.230322
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。