首站-论文投稿智能助手
典型文献
基于多尺度的蒙古文脱机手写识别方法
文献摘要:
蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式.根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则.该文提出了"十二字头"码、变形显现码和字素码 3 种字符划分方法,且拥有相互包含关系,即"十二字头"码可以分解为变形显现码、变形显现码可以进一步分解为字素码.多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做"十二字头"码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射.用三个连接时序分类器损失函数的和作为模型的总损失函数.实验结果表明,该模型在公开的蒙古文脱机手写数据集 MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为 66.22%、测试集Ⅱ上为 63.97%.
文献关键词:
蒙古文;脱机手写识别;多尺度;LSTM;CTC
作者姓名:
武慧娟;范道尔吉;白凤山;滕达;潘月彩
作者机构:
内蒙古大学 电子信息工程学院,内蒙古 呼和浩特 010021
文献出处:
引用格式:
[1]武慧娟;范道尔吉;白凤山;滕达;潘月彩-.基于多尺度的蒙古文脱机手写识别方法)[J].中文信息学报,2022(10):81-87
A类:
脱机手写识别
B类:
蒙古文,字符,无缝连接,目标序列,训练模型,地学,细节信息,构词,字头,划分方法,多尺度模型,先用,双向长短时记忆网络,序列化,第一层,连接时序分类,分类器,第二层,第三层,损失函数,MHW,最佳路径,解码,测试集,单词识别,识别准确率,CTC
AB值:
0.21022
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。