首站-论文投稿智能助手
典型文献
基于深度学习的中共党史文献命名实体识别研究
文献摘要:
[目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑.[方法/过程]本研究采用基于Trie树的字符串匹配算法完成实验语料的批量标注任务,利用中文 XLNet(Generalized Autoregressive Pre training for Language Understanding,XLNet)预训练模型嵌入主流BiLSTM-CRF模型中,构建基于XLNet-BiLSTM-CRF的中共党史文献命名实体识别模型.[结果/结论]该模型在命名实体识别中表现优异,其调和平均数F值为0.9535,高于BiLSTM-CRF、BERT-BiLSTM-CRF、BERT-wwm-ext-BiLSTM-CRF、XLNet-CRF等深度学习模型.研究表明本文提出的方法对于中共党史非结构化文本挖掘工作具有可行性和有效性.
文献关键词:
深度学习;中共党史文献;命名实体识别;XLNet模型;BiLSTM-CRF模型
作者姓名:
曹树金;岳文玉
作者机构:
中山大学信息管理学院 广州 510006
文献出处:
引用格式:
[1]曹树金;岳文玉-.基于深度学习的中共党史文献命名实体识别研究)[J].情报资料工作,2022(05):81-88
A类:
中共党史文献
B类:
命名实体识别,党史资源,专业术语,术语库,知识问答,问答系统,基础性作用,数字人文,人文研究,Trie,字符串匹配,匹配算法,语料,XLNet,Generalized,Autoregressive,Pre,training,Language,Understanding,预训练模型,模型嵌入,入主,BiLSTM,CRF,识别模型,调和平均,平均数,BERT,wwm,ext,深度学习模型,非结构化,结构化文本,文本挖掘
AB值:
0.289733
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。