首站-论文投稿智能助手
典型文献
藏汉双语场景图像数据集合成及文本检测方法
文献摘要:
为满足大量藏汉双语场景图像中的文字检测和识别的需求,合成数据集并训练深度学习模型,提出场景图像藏汉双语文本检测方法.首先,针对缺乏藏汉双语场景图像数据集的问题,提出基于轮廓检测和泊松图像编辑的合成方法,采用人工标注和自动化合成方式生成了具有相当规模的藏汉双语场景图像数据集BiTCSD,其中包含合成图像87680幅、人工标注图像5550幅;其次,验证了使用合成数据集训练模型的有效性;最后,在不同数据集上训练了深度文本框连接网络CTPN,并在测试集上针对不同语种评价了模型的文本检测性能.实验结果表明:通过合成样本训练CTPN模型,能够使模型的文本检测指标大幅提升;训练后的CTPN能够以较高的准确率和召回率检测场景图像中的藏汉双语文本区域,针对藏语文本的检测准确率P、召回率R和F值分别为0.91,0.85和0.88;针对汉语文本的检测准确率P、召回率R和F值分别为0.89,0.83和0.86.
文献关键词:
场景文本检测;藏汉双语;合成数据集;深度学习
作者姓名:
郝玉胜;王维兰;李金成;林强
作者机构:
西北民族大学数学与计算机科学学院 兰州 730030;中国民族语言文字信息技术教育部重点实验室 兰州 730030;西北民族大学流数据计算与应用重点实验室 兰州 730030
引用格式:
[1]郝玉胜;王维兰;李金成;林强-.藏汉双语场景图像数据集合成及文本检测方法)[J].计算机辅助设计与图形学学报,2022(04):592-604
A类:
BiTCSD
B类:
藏汉双语,语场,场景图像,图像数据集,数据集合,文字检测,检测和识别,合成数据集,深度学习模型,出场,轮廓检测,图像编辑,合成方法,自动化合成,合成方式,相当规模,合成图,集训,训练模型,文本框,连接网络,CTPN,测试集,不同语种,检测性能,合成样本,样本训练,检测指标,召回率,本区,藏语文,检测准确率,汉语文本,场景文本检测
AB值:
0.295234
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。