典型文献
基于聚类算法的离散文本同行合并方法研究
文献摘要:
印刷品资料等文本图像中存在的局部并列换行现象会导致文本排版识别错误,本文提出的基于聚类算法的离散文本同行合并方法,能够自动将局部并列换行的文本正确归并到同行,得到正确的文本排版结果,有利于图像文本信息结构化数据的提取和处理.
文献关键词:
OCR;局部并列换行;文本检测;聚类
中图分类号:
作者姓名:
金成伟
作者机构:
中通服中睿科技有限公司,广东广州510030
文献出处:
引用格式:
[1]金成伟-.基于聚类算法的离散文本同行合并方法研究)[J].通讯世界,2022(03):64-66
A类:
局部并列换行
B类:
聚类算法,散文,行合并,印刷品,文本图像,排版,本正,归并到,文本信息,信息结构,结构化数据,OCR,文本检测
AB值:
0.351423
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。