典型文献
面向配网一次设备缺陷文本命名实体识别研究
文献摘要:
配网系统存储着大量闲置的设备缺陷文本,可采用命名实体识别技术对其进行挖掘和利用.针对目前电力设备缺陷文本数据人工标注效率低,且专业领域实体识别困难的问题,提出一种新的标注策略和基于Bert-CRF(Bidirec-tional encoder representation from transformers-Conditional Random Fields)的命名实体识别模型.利用基于半监督学习的BIO(Begin、Internal、Other)标注,减少人工标注占比,提升标注速率,接着利用Bert预训练模型得到包含丰富语义信息的动态词向量,最后利用CRF层对标签进行约束.所提模型在自制配网一次设备缺陷文本数据集上进行了对比试验,该数据集包含9 186条文本数据,12个大类25个小类.实验结果表明,文中模型取得了很好的效果,精确率、召回率和F1 值分别达到97.85%、97.36%、97.34%,验证了该模型优于其他5种模型.
文献关键词:
命名实体识别;缺陷文本;半监督学习;Bert-CRF
中图分类号:
作者姓名:
刘雨可;周申培;石英;杜家宝
作者机构:
武汉理工大学自动化学院,武汉430070
文献出处:
引用格式:
[1]刘雨可;周申培;石英;杜家宝-.面向配网一次设备缺陷文本命名实体识别研究)[J].武汉理工大学学报,2022(10):93-101
A类:
Bidirec,Begin
B类:
配网,一次设备,本命,命名实体识别,系统存储,闲置,电力设备缺陷文本,文本数据,Bert,CRF,encoder,representation,from,transformers,Conditional,Random,Fields,识别模型,半监督学习,BIO,Internal,Other,预训练模型,富语义,语义信息,词向量,行约,条文,精确率,召回率
AB值:
0.308719
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。