典型文献
基于Faster-RCNN的水书古籍手写文字的检测与识别
文献摘要:
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输入进行实验,在全部80个目标类别上获得了91.95% 的平均识别率,实现了页面级的端到端的水书古籍文字的准确定位与识别.实验结果表明,Faster-RCNN模型在目前的数据集上能很好地实现水书手写文字的检测与识别,文中采用的数据扩增方式能明显提升水书手写文字的识别率,为水书文化的保护和传承提供了新思路,对于解决实际应用场景中的水书文字识别问题具有重要意义.
文献关键词:
水书;手写中文文字识别;Faster-RCNN;页面级文字识别;数据扩增
中图分类号:
作者姓名:
汤敏丽;谢少敏;刘向荣
作者机构:
厦门大学信息学院,福建 厦门 361005;凯里学院大数据工程学院,贵州 凯里 556011;厦门大学闽台非遗文化数字化保护与智能处理文化和旅游部重点实验室,福建 厦门 361005
文献出处:
引用格式:
[1]汤敏丽;谢少敏;刘向荣-.基于Faster-RCNN的水书古籍手写文字的检测与识别)[J].厦门大学学报(自然科学版),2022(02):272-277
A类:
手写中文文字识别,页面级文字识别
B类:
Faster,RCNN,水书,古籍,检测与识别,产水,失传,数据集建立,样本不平衡,鲜少,文字检测,字数,数据扩增,增方,字符,faster,region,convolutional,neural,network,算法应用,不同组合,识别率,端到端,准确定位,升水,保护和传承
AB值:
0.240521
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。