典型文献
文档数据化:概念、框架与方法
文献摘要:
数据价值已经得到社会各界的高度认可.为进一步利用大数据、人工智能等技术释放数据的价值,文档数据化的概念被提出并日益受到重视,也成为图书情报与档案管理学科数字转型的新领域.经多学科概念与方法的综合和推演,本文对文档数据化的概念内涵、内容框架和关键方法展开系统研究.研究发现,文档数据化是面向文档的开发利用,将文档转变为机器可识别、可分析、可计算的数据的过程;智能技术允许机器参与到文档数据化的决策过程中,使得文档数据化呈现出人机协同、利用驱动、粒度细化、面向计算的特点.基于以上研究,本文提出文档数据化的任务框架,包含转录识别、描述增强、关联构建和矢量处理四项任务,呈现出结构化、语义化和智能化三个维度上面向机器的演进机制.对各项任务涉及的基础方法和关键方法进行梳理后可知,以深度学习、自然语言处理等技术为核心的文档数据化方法正在发挥越来越重要的作用.
文献关键词:
文档;数据化;非结构化数据;结构化;量化
中图分类号:
作者姓名:
杨建梁;刘越男;祁天娇
作者机构:
中国人民大学信息资源管理学院、数据工程与知识工程教育部重点实验室、中国人民大学电子文件管理研究中心 北京100872
文献出处:
引用格式:
[1]杨建梁;刘越男;祁天娇-.文档数据化:概念、框架与方法)[J].中国图书馆学报,2022(03):63-78
A类:
矢量处理
B类:
文档,数据化,数据价值,图书情报与档案管理学,管理学科,数字转型,新领域,推演,概念内涵,内容框架,可计算,决策过程,人机协同,粒度细,关联构建,四项,语义化,上面,演进机制,各项任务,自然语言处理,非结构化数据
AB值:
0.329341
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。