典型文献
DPENet:轻量化文档姿态估计网络
文献摘要:
现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题.从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题.将文档图像中的单一文档视为一个姿态估计对象,将文档的四个角点视为文档对象的四个姿态估计点,采用兼具全连接回归与高斯热图回归优点的DSNT(differentiable spatial to numerical transform)模块实现文档图像角点的高精度定位,并通过透视变换处理实现透视变形文档图像的高精度矫正.DPENet采用轻量化设计,以面向移动端的MobileNet V2为主干网络,模型体量只有10.6 MB.在SmartDoc-QA(仅取148张文档图像)数据集上与现有的三种主流网络进行了对比实验,实验结果表明,DPENet的矫正成功率(96.6%)和平均位移误差(mean displacement error,MDE)(1.28个像素)均优于其他三种网络,同时其平均矫正速度也有良好的表现.在保持轻量化和速度快的条件下,DPENet网络具有更高的变形文档矫正成功率和矫正精度.
文献关键词:
姿态估计;深度学习;文档图像矫正;轻量化网络;MobileNet V2
中图分类号:
作者姓名:
韩晶;吕学强;张祥祥;郝伟;张凯
作者机构:
北京信息科技大学 网络文化与数字传播北京市重点实验室,北京 100101;首都师范大学 中国语言智能研究中心,北京 100048
文献出处:
引用格式:
[1]韩晶;吕学强;张祥祥;郝伟;张凯-.DPENet:轻量化文档姿态估计网络)[J].计算机工程与应用,2022(22):210-218
A类:
DPENet,DSNT,SmartDoc,文档图像矫正
B类:
姿态估计,倾斜变形,深度学习模型,泛化性,模型参数量,推理速度,速度慢,lightweight,document,pose,estimation,network,一文,角点,全连接,接回,热图,differentiable,spatial,numerical,transform,高精度定位,过透,透视变换,变换处理,轻量化设计,移动端,MobileNet,V2,主干网络,MB,QA,流网,平均位移,位移误差,mean,displacement,error,MDE,像素,轻量化网络
AB值:
0.338155
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。