典型文献
任意方向自然场景文本识别
文献摘要:
自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法.使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注意机制使模型专注于字符上,并采用可微分二值化函数进一步加大网络对前景的注意力,削弱对背景区域的关注,网络对每个像素点进行37分类,并使用文本转录模块将分类结果按照从左到右的顺序转换成文本.该算法在包括ICDAR2013,ICDAR2003,SVTP,CUTE,IIIT5k的多个标准数据集上进行测试,测试结果表明,无论是规则文本还是不规则文本都取得了不错的效果,其中,在弯曲文本CUTE上的识别精度高达83.3%,充分证明了提出算法的有效性.
文献关键词:
自然场景文本识别;卷积长短时记忆网络(ConvLSTM);字符注意力机制
中图分类号:
作者姓名:
朱莉;陈宏;景小荣
作者机构:
重庆邮电大学 通信与信息工程学院,重庆400065;四川师范大学 物理与电子工程学院,成都610101;重庆邮电大学 移动通信技术重庆市重点实验室,重庆400065
文献出处:
引用格式:
[1]朱莉;陈宏;景小荣-.任意方向自然场景文本识别)[J].重庆邮电大学学报(自然科学版),2022(01):125-133
A类:
ICDAR2003,SVTP,IIIT5k,字符注意力机制
B类:
任意方向,自然场景文本识别,计算机视觉,识别算法,分割网络,基础框架,框架提取,空间信息,卷积长短时记忆网络,时空序列,序列信息,注意机制,可微分,二值化,大网,背景区域,像素点,从左到右,转换成,成文,ICDAR2013,CUTE,标准数据集,不错,识别精度,充分证明,ConvLSTM
AB值:
0.312331
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。