典型文献
数字人文视域下典籍动物命名实体识别研究——以SikuBERT预训练模型为例
文献摘要:
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义.文章基于SikuBERT预训练模型,构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法.利用25部经人工标注动物命名实体的先秦典籍语料,对SikuBERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证SikuBERT预训练模型的识别性能.结果表明:基于SikuBERT经训练所构建的动物命名实体识别模型效果最优,十折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%.
文献关键词:
数字人文;典籍;动物命名实体识别;SikuBERT;深度学习
中图分类号:
作者姓名:
林立涛;王东波;刘江峰;李斌;冯敏萱
作者机构:
南京农业大学信息管理学院;南京师范大学文学院
文献出处:
引用格式:
[1]林立涛;王东波;刘江峰;李斌;冯敏萱-.数字人文视域下典籍动物命名实体识别研究——以SikuBERT预训练模型为例)[J].图书馆论坛,2022(10):42-50
A类:
动物命名实体识别,SikuBERT
B类:
数字人文,预训练模型,特定领域,文本挖掘,识别模型,知识挖掘,先秦典籍,语料,模型发展,CRF,Bi,识别性,经训,调和平均,高一,史记,识别准确率
AB值:
0.141545
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。