典型文献
基于数据增强的领域知识图谱构建方法研究
文献摘要:
[目的/意义]探究使用大数据技术解决传统制造业知识管理问题的方法,实现对专利知识的自动抽取和结构化构建,提高信息检索效率和利用率.[方法/过程]结合深度学习技术,提出了一种面向非结构化专利信息的知识图谱自动构建方法,在BiLSTM-CRF的基础上引入预训练模型实现对实体和开放式关系的自动抽取,并基于迁移学习进行数据增强提升抽取效果;改进实体关系抽取模型提升三元组结构识别的准确率;最后将其存储到Neo4j图数据库中进行领域知识图谱的构建.[结果/结论]本文提出的方法解决了信息抽取在专业领域样本量少的问题,对专利三元组识别的准确率达到了 94.71%,构建的知识图谱能够满足企业创新知识管理和竞争情报获取的需求,提升企业知识的可重用性.
文献关键词:
专利;数据增强;信息抽取;三元组识别;新能源汽车电池技术领域
中图分类号:
作者姓名:
钱玲飞;崔晓蕾
作者机构:
南京航空航天大学经济与管理学院,江苏南京211106
文献出处:
引用格式:
[1]钱玲飞;崔晓蕾-.基于数据增强的领域知识图谱构建方法研究)[J].现代情报,2022(03):31-39
A类:
三元组识别,新能源汽车电池技术领域
B类:
数据增强,领域知识图谱,知识图谱构建,构建方法,传统制造业,知识管理,管理问题,专利知识,自动抽取,信息检索,深度学习技术,非结构化,专利信息,自动构建,BiLSTM,CRF,预训练模型,模型实现,迁移学习,实体关系抽取,取模,组结构,结构识别,Neo4j,图数据库,信息抽取,样本量,企业创新,新知识,竞争情报,可重用性
AB值:
0.312391
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。