首站-论文投稿智能助手
典型文献
融合文本特征的老挝语文字识别方法研究
文献摘要:
老挝语属于低资源语言,文本语料稀缺使得老挝语自然语言处理的基础任务难以开展,而老挝语的光学字符识别研究在一定程度上能解决语料匮乏的问题.该文提出一种融合老挝语词法、字符向量等文本特征的老挝语文字识别方法.首先,该方法以具有残差结构的卷积神经网络为主干,加入卷积注意力模块,以提取老挝文字图片的图片特征信息;其次,通过注意力机制动态分配权重组合图片特征信息与Glove预训练的词向量及字符向量;再有,用双向长短期记忆网络编码组合特征,以预测老挝文字序列标签的真实分布,同时,融入老挝音节组成规则,以预测音节规则标签分支优化老挝文字识别模型;最后,采用连接时序分类对标签分布进行序列对齐.实验结果表明,该方法取得了较好的老挝文字识别效果,准确率达到了88.63%.
文献关键词:
老挝文字识别;词法特征;特征融合;注意力机制;残差结构
作者姓名:
杨志婥琪;周兰江;周蕾越
作者机构:
昆明理工大学 信息工程与自动化学院,昆明650500;昆明理工大学 津桥学院 电子与信息工程学院,昆明650106
引用格式:
[1]杨志婥琪;周兰江;周蕾越-.融合文本特征的老挝语文字识别方法研究)[J].小型微型计算机系统,2022(04):723-730
A类:
老挝文字识别,词法特征
B类:
文本特征,老挝语,低资源语言,语料,稀缺,自然语言处理,光学字符识别,语词,残差结构,卷积注意力模块,图片特征,特征信息,注意力机制,动态分配,分配权重,权重组合,Glove,预训练,词向量,再有,双向长短期记忆网络,网络编码,组合特征,音节,成规,测音,识别模型,连接时序分类,标签分布,对齐,特征融合
AB值:
0.25771
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。