典型文献
基于Encoder-Decoder框架的双监督机制自然场景文本识别
文献摘要:
针对复杂的自然场景下文本较难识别的情况,特别是对不规则文本的识别仍很具挑战性,提出了一种具有注意机制的双监督网络.考虑到在现实世界中阅读单词时通常不会在脑海中纠正他,而是调整焦点和视觉范围.在特征提取过程中利用几何结构可调的可变形卷积层结合文本注意模块,强制模型专注于文本区域,无需对不规则的文本进行位置纠正.该文的总体框架有两个分支监督,一个监督分支来自上下文级别建模,另一个监督分支来自一个额外的监督增强分支,旨在处理角色级别的不明确的语义信息.这两个监督可以相互促进,并产生更好的性能.所提出的方法可以识别任意长度的文本,并且不需要任何预定义的词典.实验表明,与对比方法相比,提出的方法在场景文本基准数据集上的识别精度有明显提升.
文献关键词:
场景文本识别;注意力机制;双监督
中图分类号:
作者姓名:
陈佐瓒;徐兵;丁小军;甘井中
作者机构:
玉林师范学院 计算机科学与工程学院,广西 玉林 537000;南京师范大学 地理科学学院,南京 210023;中南大学 计算机学院,长沙 410083
文献出处:
引用格式:
[1]陈佐瓒;徐兵;丁小军;甘井中-.基于Encoder-Decoder框架的双监督机制自然场景文本识别)[J].计算机工程与应用,2022(06):128-133
A类:
双监督机制
B类:
Encoder,Decoder,自然场景文本识别,注意机制,监督网络,现实世界,阅读单,单词,脑海中,几何结构,可变形卷积,卷积层,注意模块,本区,总体框架,上下文,强分支,语义信息,任意长度,预定,词典,比方,基准数据集,识别精度,注意力机制
AB值:
0.357501
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。