首站-论文投稿智能助手
典型文献
基于行列信息门的表格结构识别网络
文献摘要:
目前基于深度学习的表格结构识别有2种主流方法:检测表格框线法和检测表格行与列法.在检测表格框线法中,表格框线所占像素数较少导致了正负样本失衡的问题.虽然检测表格行与列法避免了正负样本失衡的问题,但有的研究将行与列预测分别简化成一列与一行像素的预测,又造成了容错率大的问题.针对该问题,提出了2种信息传输模块:行信息门和列信息门.在模块内,通过特征切片和平铺来对行或列进行软预测,解决了简化行与列预测产生的大容错率问题;通过计算通道注意力进一步提取行或列信息;使用行信息门与列信息门搭建了一个语义分割模型,同时完成表格行分割与列分割.在ICDAR 2013数据集上构建表格的行与列掩模并对模型评估,验证结果表明,与基于检测表格行与列法的分割模型相比,提出的模型有更好的性能,平均查准率、 查全率和F1值分别高出0.55%,2.78%和1.48%.
文献关键词:
深度学习;表格结构识别;行信息门;列信息门
作者姓名:
包云超;周全;孔令军;王茜雯
作者机构:
南京邮电大学 通信与信息工程学院, 江苏 南京 210003;金陵科技学院 网络与通信工程学院, 江苏 南京 211169
文献出处:
引用格式:
[1]包云超;周全;孔令军;王茜雯-.基于行列信息门的表格结构识别网络)[J].无线电工程,2022(03):463-469
A类:
列信息门,行信息门,特征切片,ICDAR
B类:
行列,表格结构识别,识别网络,主流方法,像素数,正负样本,一列,一行,行像,容错率,信息传输,平铺,测产,通道注意力,语义分割,分割模型,建表,掩模,模型评估,查准率,查全率
AB值:
0.279223
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。