典型文献
基于卷积神经网络和Transformer的手写体英文文本识别
文献摘要:
手写体文本识别技术可以将手写文档转录成可编辑的数字文档.但由于手写的书写风格迥异、文档结构千变万化和字符分割识别精度不高等问题,基于神经网络的手写体英文文本识别仍面临着许多挑战.针对上述问题,提出基于卷积神经网络(CNN)和Transformer的手写体英文文本识别模型.首先利用CNN从输入图像中提取特征,而后将特征输入到Transformer编码器中得到特征序列每一帧的预测,最后经过链接时序分类(CTC)解码器获得最终的预测结果.在公开的IAM(Institut für Angewandte Mathematik)手写体英文单词数据集上进行了大量的实验结果表明,该模型获得了3.60%的字符错误率(CER)和12.70%的单词错误率(WER),验证了所提模型的可行性.
文献关键词:
手写体英文文本识别;深度学习;卷积神经网络;Transformer;链接时序分类;注意力;无分割
中图分类号:
作者姓名:
张显杰;张之明
作者机构:
武警工程大学信息工程学院,西安710086;武警工程大学研究生大队,西安710086
文献出处:
引用格式:
[1]张显杰;张之明-.基于卷积神经网络和Transformer的手写体英文文本识别)[J].计算机应用,2022(08):2394-2400
A类:
手写体英文文本识别,Institut,Mathematik,无分割
B类:
Transformer,文档,录成,可编,迥异,千变万化,字符分割,识别精度,识别模型,提取特征,编码器,特征序列,一帧,链接时序分类,CTC,解码器,IAM,Angewandte,英文单词,词数,错误率,CER,WER
AB值:
0.244841
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。