首站-论文投稿智能助手
典型文献
多模态公文的结构知识抽取与组织研究
文献摘要:
针对目前基于三元组知识构建的知识图谱结构逻辑性弱、难以形成知识体系的问题,以公文应用背景为牵引,提出多模态知识结构要素抽取模型,构建多模态公文文档数据集GovDoc-CN,在文本和图像两个模态对文档中包括各级标题、摘要、作者、成文时间、文档编号等在内的知识结构要素进行抽取.设计文档结构树模型对抽取的文档知识结构要素进行组织,并构建结构化图网络实现文档的组织和管理.实验证明,相较于单一模态的抽取模型,多模态知识结构要素抽取模型取得了明显的效果提升,文档结构树模型和基于文档结构树模型构建的结构化图网络为文档知识的组织与管理提供了一种新途径,具有重要的应用价值.
文献关键词:
多模态;信息抽取;知识组织;文档结构化;公文自动化
作者姓名:
徐瑞麟;耿伯英;刘树衎
作者机构:
海军工程大学电子工程学院,湖北武汉430033;中国人民解放军91001部队,北京100036;东南大学计算机科学与工程学院,江苏南京211189
引用格式:
[1]徐瑞麟;耿伯英;刘树衎-.多模态公文的结构知识抽取与组织研究)[J].系统工程与电子技术,2022(07):2241-2250
A类:
GovDoc,公文自动化
B类:
结构知识,知识抽取,三元组,知识构建,结构逻辑,逻辑性,应用背景,知识结构,结构要素,取模,CN,和图像,标题,摘要,成文时间,编号,构树,树模型,图网络,组织和管理,效果提升,组织与管理,信息抽取,知识组织,文档结构化
AB值:
0.338089
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。