典型文献
基于编码器-解码器的离线手写数学公式识别
文献摘要:
提出一种改进的编码器-解码器模型.模型采用多尺度密集卷积网络作为编码器,以提取手写数学公式图像的多分辨率特征.采用完全基于注意力机制的Transformer模型作为解码器,依据图像特征将二维手写数学公式解码为一维LaTeX序列.通过相对位置编码嵌入图像位置信息和LaTeX符号位置信息.实验结果表明,模型在官方CROHME 2014数据集上取得了优异的性能,相比于当前最先进的方法,其公式识别准确率提高了3.55%,字错误率降低了1.41%.
文献关键词:
编码器-解码器;离线手写数学公式识别;多尺度密集卷积网络;Transformer模型;相对位置编码
中图分类号:
作者姓名:
杜永涛;余元辉
作者机构:
集美大学计算机工程学院, 福建 厦门361021
文献出处:
引用格式:
[1]杜永涛;余元辉-.基于编码器-解码器的离线手写数学公式识别)[J].集美大学学报(自然科学版),2022(06):570-576
A类:
离线手写数学公式识别,多尺度密集卷积网络
B类:
编码器,解码器,式图,多分辨率,注意力机制,Transformer,图像特征,LaTeX,相对位置编码,位置信息,CROHME,最先,识别准确率,错误率
AB值:
0.177095
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。