典型文献
基于图像统计学聚类的非规则表格处理算法
文献摘要:
机械表格类档案广泛存在于生产、制造等领域,包括机械工艺卡、零部件测试报表等.纸质版机械表格类档案数字化,以及对表格中的表格、文字等有效元素进行提取,是有效管理机械类产品的关键内容.现有表格有效元素提取算法成果较为丰富,但对存在纵向框线为虚线、纵向框线错位、连续跨页等现象的非规则表格处理效果不佳.针对纵向直线不连续、框线错位的表格,提出一种图像统计学聚类表格识别分割算法,提高了算法的自适应能力及鲁棒性;然后针对表格跨页问题提出一种基于局部小区域内像素占比的跨页拼接算法,最终实现了机械产品中非规则表格的数字化复现.对现有的147张存在非规则现象的机械零部件测试报表进行数字化(分辨率为75 dpi~400 dpi)后,利用所提算法进行迭代测试,非规则表格的定位分割拼接准确率可达97.32%.实验证明了该方法的有效性.
文献关键词:
投影统计;聚类;表格交点提取;跨页拼接;数字化复现
中图分类号:
作者姓名:
吕志刚;李亮亮;王洪喜;王鹏;李晓艳
作者机构:
西安工业大学 机电工程学院,陕西 西安 710021;西安工业大学 电子信息工程学院,陕西 西安 710021
文献出处:
引用格式:
[1]吕志刚;李亮亮;王洪喜;王鹏;李晓艳-.基于图像统计学聚类的非规则表格处理算法)[J].计算机集成制造系统,2022(06):1755-1766
A类:
跨页拼接,数字化复现,投影统计,表格交点提取
B类:
理算,机械表,工艺卡,报表,纸质版,档案数字化,有效管理,机械类,类产品,关键内容,元素提取,虚线,处理效果,表格识别,分割算法,自适应能力,小区域,内像素,拼接算法,机械产品,机械零部件,dpi
AB值:
0.313172
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。