首站-论文投稿智能助手
典型文献
基于知识蒸馏的缅甸语光学字符识别方法
文献摘要:
与传统的图像文本识别任务不同,缅甸语光学字符识别(Optical character recognition,OCR)需要计算机在一个感受野内识别由多个字符嵌套组合的复杂字符,这给缅甸语OCR任务带来了巨大的挑战.为了解决该问题,提出了一种基于知识蒸馏的缅甸语OCR方法,构建了使用卷积神经网络(Convolutional neural networks,CNN)+循环神经网络(Recurrent neural network,RNN)框架的教师网络和学生网络,以集成学习的方式进行训练的模型架构,在训练过程中通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取.实验结果表明,在没有背景噪声图像和有背景噪声图像作为训练数据集的情况下,本文模型的性能分别优于基线2.9%和2.7%.
文献关键词:
缅甸语;光学字符识别;卷积神经网络+循环神经网络;知识蒸馏;图像特征对齐
作者姓名:
毛存礼;谢旭阳;余正涛;高盛祥;王振晗;刘福浩
作者机构:
昆明理工大学信息工程与自动化学院,昆明 650500;昆明理工大学云南省人工智能重点实验室,昆明650500
文献出处:
引用格式:
[1]毛存礼;谢旭阳;余正涛;高盛祥;王振晗;刘福浩-.基于知识蒸馏的缅甸语光学字符识别方法)[J].数据采集与处理,2022(01):173-182
A类:
图像特征对齐
B类:
基于知识,知识蒸馏,缅甸语,光学字符识别,文本识别,Optical,character,recognition,OCR,感受野,个字符,嵌套,杂字,Convolutional,neural,networks,循环神经网络,Recurrent,RNN,教师网络,学生网络,集成学习,模型架构,训练过程,子网络,中局,局部特征,背景噪声,噪声图像,训练数据集
AB值:
0.304719
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。