典型文献
基于二维CTC和注意力序列的场景文本识别模型
文献摘要:
为提高当前场景文本识别算法在自然场景下识别不规则文本和中文文本的准确率,提出了一种基于二维(2D)CTC和注意力机制序列的自然场景文本识别模型.该模型分为编码部分和解码部分,利用二维CTC自适应地关注文本的空间位置信息,同时排除背景噪声的影响.通过在ICDAR数据集上的实验结果表明,对比CTC和Seq2Seq的模型,提高了对不规则文本和中文文本识别的准确率,同时加快了收敛速度.
文献关键词:
二维CTC;注意力机制;序列到序列;空间信息
中图分类号:
作者姓名:
孙洁;朱玉全;黄承宁
作者机构:
南京工业大学浦江学院计算机与通信工程学院,江苏南京,211200;江苏大学计算机科学与通信工程学院,江苏镇江,212013
文献出处:
引用格式:
[1]孙洁;朱玉全;黄承宁-.基于二维CTC和注意力序列的场景文本识别模型)[J].电子制作,2022(17):65-70
A类:
ICDAR
B类:
CTC,识别模型,前场,识别算法,中文文本,2D,注意力机制,自然场景文本识别,部分和,解码,注文,空间位置信息,背景噪声,Seq2Seq,收敛速度,序列到序列,空间信息
AB值:
0.293386
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。