首站-论文投稿智能助手
典型文献
复杂表格数据化中的单元格语义关系识别研究
文献摘要:
复杂表格能够以简单、直观的方式描述数据,被广泛应用于各行各业,然而,复杂表格具有结构复杂、单元格类型多样、表格文档构成方式不一等问题,需要进行数据化处理后才能实现共享与复用.因此,本文构建一种基于无监督学习的单元格语义关系识别模型来实现复杂表格数据化,首先利用机器视觉技术实现复杂表格分割,然后基于表格结构和内容相似度识别同模板表格,在此基础上,结合表头单元格、说明性单元格、表体单元格3类单元格的取值、位置特点,设置启发式规则进行单元格语义关系的识别,最后通过实证研究验证本文的方法能够在复杂表格数据化中取得较高的准确率和召回率,具有可行性.
文献关键词:
复杂表格;语义关系;表格数据化;机器视觉
作者姓名:
林鑫;余华娟;闫奕臻
作者机构:
华中师范大学信息管理学院,武汉 430079;湖北省数据治理与智能决策研究中心,武汉 430079
文献出处:
引用格式:
[1]林鑫;余华娟;闫奕臻-.复杂表格数据化中的单元格语义关系识别研究)[J].数字图书馆论坛,2022(09):28-35
A类:
复杂表格,表格数据化
B类:
单元格,格语,语义关系,关系识别,文档,构成方式,复用,无监督学习,识别模型,机器视觉技术,结构和内容,内容相似度,相似度识别,表头,说明性,启发式规则,召回率
AB值:
0.20299
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。