首站-论文投稿智能助手
典型文献
基于深度学习的《方志物产》用途实体自动识别模型构建与应用
文献摘要:
以特色馆藏文献《方志物产》为研究语料,基于人工标注语料,运用Bi-LSTM、Bi-LSTM-CRF、BERT、Siku-BERT等4种深度学习模型开展实验,以精确率P、召回率R、调和平均数F作为测试指标,对模型的识别性能进行对比分析,促进物产知识的挖掘和利用.实验结果显示:相较于基于CRF的模型,4种深度学习模型的整体性能取得明显提升;Bi-LSTM、Bi-LSTM-CRF、BERT、Siku-BERT的最好R值分别为74.80%、78.05%、88.62%、89.74%;BERT、Siku-BERT注意力机制类深度学习模型的识别效果优于Bi-LSTM、Bi-LSTM-CRF循环类深度学习模型.由于方志类古籍文本结构复杂多样、人工标注精度存在误差、语料规模较小等因素,自动识别模型的实体抽取性能仍有较大的优化空间,但深度学习模型在方志类古籍的内容挖掘中表现出一定的优越性,且不同语料间预训练模型的迁移应用具有可行性.
文献关键词:
深度学习;方志物产;命名实体识别;数字人文;用途实体
作者姓名:
李娜
作者机构:
南京林业大学人文社会科学学院,南京 210037
文献出处:
引用格式:
[1]李娜-.基于深度学习的《方志物产》用途实体自动识别模型构建与应用)[J].数字图书馆论坛,2022(12):19-28
A类:
方志物产,用途实体,Siku
B类:
自动识别,识别模型,模型构建与应用,特色馆藏,藏文,Bi,CRF,BERT,深度学习模型,精确率,召回率,调和平均,平均数,测试指标,识别性,整体性能,能取,注意力机制,古籍,文本结构,语料规模,规模较,实体抽取,预训练模型,迁移应用,命名实体识别,数字人文
AB值:
0.254508
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。