典型文献
基于文本行匹配的跨图文本阅读方法
文献摘要:
通过摄像头阅读文本可帮助计算机理解文本内容.然而,由于摄像头视野的局限性和中文文本识别的复杂性,计算机有时很难通过摄像头从单张文本图像获取完整的文本内容,因此定义了跨图文本阅读任务,旨在从一对具有重叠区域的文本图像中获取完整的文本内容.针对跨图文本阅读任务,提出了基于文本行匹配的跨图文本阅读方法.首先采用文本检测网络来裁剪文本行,然后设计了基于多头自注意力机制的文本行匹配网络来预测文本行的匹配关系,最后提出了基于编辑的文本阅读网络,以去除重叠文本并读取文本内容.为了训练和评估跨图文本阅读方法,构造了跨图中文文本阅读数据集(Cross-image Chinese Text Reading Dataset,CCTR).在CCTR数据集上进行实验,结果表明,相比像素级拼接和识别方法,所提方法能够得到更高的阅读性能,验证了其优越性.
文献关键词:
跨图文本阅读;跨图中文文本阅读数据集;文本行匹配;基于编辑的文本阅读;注意力机制
中图分类号:
作者姓名:
戴禹;许林峰
作者机构:
电子科技大学信息与通信工程学院 成都611731
文献出处:
引用格式:
[1]戴禹;许林峰-.基于文本行匹配的跨图文本阅读方法)[J].计算机科学,2022(09):139-145
A类:
文本行匹配,跨图文本阅读,基于编辑的文本阅读,跨图中文文本阅读数据集
B类:
阅读方法,摄像头,阅读文本,理解文本,文本内容,文本识别,单张,文本图像,阅读任务,重叠区域,文本检测,测网,裁剪,多头自注意力机制,匹配网络,匹配关系,阅读网,读取,Cross,image,Chinese,Text,Reading,Dataset,CCTR,像素级,拼接
AB值:
0.187706
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。