典型文献
文档智能:数据集、模型和应用
文献摘要:
文档智能是指通过计算机进行自动阅读、理解以及分析商业文档的过程,是自然语言处理和计算机视觉交叉领域的一个重要研究方向.近年来,深度学习技术的普及极大地推动了文档智能领域的发展,以文档版面分析、文档信息抽取、文档视觉问答以及文档图像分类等为代表的文档智能任务均有显著的性能提升.该文对于早期基于启发式规则的文档分析技术、基于统计机器学习的算法以及近年来基于深度学习和预训练的方法进行简要介绍,并展望了文档智能技术的未来发展方向.
文献关键词:
文档智能;深度学习;多模态自然语言处理
中图分类号:
作者姓名:
崔磊;徐毅恒;吕腾超;韦福如
作者机构:
微软亚洲研究院 自然语言计算组,北京100080
文献出处:
引用格式:
[1]崔磊;徐毅恒;吕腾超;韦福如-.文档智能:数据集、模型和应用)[J].中文信息学报,2022(06):1-19
A类:
文档智能,多模态自然语言处理
B类:
计算机视觉,交叉领域,深度学习技术,智能领域,版面,信息抽取,视觉问答,文档图像,图像分类,智能任务,性能提升,启发式规则,统计机器学习,预训练
AB值:
0.266447
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。