首站-论文投稿智能助手
典型文献
基于表格检索和机器学习二阶段的文献表格相关文本自动识别
文献摘要:
学术文献中的表格以结构化的形式高度凝练地展示了文献中的核心知识.主流文献检索引擎中已逐步开始使用表格内容作为文字摘要的补充,以帮助科研人员快速掌握研究工作核心,提升科研工作效率.但是在仅展示表格而不提供表格的相关信息(对表格进行描述或解释的文本)的情况下,读者往往难以充分理解表格内容,阻碍文献阅读效率的进一步提升.本文提出一种基于表格检索和机器学习二阶段的表格相关文本识别方法,阶段一运用表格内容进行全文检索,获取潜在相关文本;阶段二构建机器学习模型,判断表格与潜在相关文本间的相关性,从而实现文献中表格相关文本的自动识别.以Text Retrieval Conference会议论文数据集为例,验证本文所提出的方法的有效性,证明该方法能够快速抽取文献中与图表相关的文本,为现有的论文图表抽取式摘要相关研究提供借鉴,对提高科研人员文献调研效率具有重要的现实意义.
文献关键词:
文献表格;表格理解;机器学习
作者姓名:
黄佳妮;于丰畅
作者机构:
武汉大学信息管理学院,武汉 430072
文献出处:
引用格式:
[1]黄佳妮;于丰畅-.基于表格检索和机器学习二阶段的文献表格相关文本自动识别)[J].数字图书馆论坛,2022(11):34-42
A类:
文献表格,表格理解
B类:
二阶段,自动识别,学术文献,核心知识,文献检索,检索引擎,科研人员,科研工作,分理,解表,文献阅读,阅读效率,文本识别,全文检索,机器学习模型,Text,Retrieval,Conference,会议论文,论文数,集为,图表,表相,抽取式摘要,文献调研
AB值:
0.335752
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。