首站-论文投稿智能助手
典型文献
基于Transformer的低质场景字符检测算法
文献摘要:
为了提升低质场景文本图像的文字检测和识别性能,提出一种基于Transformer的字符级场景文本检测算法.依据场景文本行中的字符顺序,设计基于Transformer的编码-解码结构,能够输出每个字符检测框的坐标以及排序预测.根据匈牙利算法的思想,设计了基于字符检测框坐标及排序损失的损失函数,以提高匹配检测结果的准确性.在3个字符级标注的场景文本数据集上的场景字符检测、场景字符识别的相关实验结果表明,所提算法能够取得较好的性能,在多个评价指标上均优于对比算法.
文献关键词:
低质场景文本;场景字符检测;Transformer;场景字符识别
作者姓名:
张重生;陈杰;纵瑞星;杨帅磊;凡高娟
作者机构:
河南大学 计算机与信息工程学院,开封475001;河南省大数据分析与处理重点实验室,开封475001
引用格式:
[1]张重生;陈杰;纵瑞星;杨帅磊;凡高娟-.基于Transformer的低质场景字符检测算法)[J].北京邮电大学学报,2022(02):124-130
A类:
场景字符检测,低质场景文本,场景字符识别
B类:
Transformer,检测算法,文本图像,文字检测,检测和识别,识别性,场景文本检测,文本行,解码,个字符,匈牙利算法,损失函数,高匹配,匹配检测,文本数据,对比算法
AB值:
0.247721
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。