典型文献
基于Kbert文本聚类模型的变压器故障识别
文献摘要:
变压器故障分析报告文本包含设备故障现象的描述,但描述语言因人而异、专业性强,且单个故障描述文本中可能存在多种故障类型,造成机器自动判断困难.因此提出一种针对变压器故障描述进行具体故障类型聚类的机器识别算法Kbert(BERT+K-Means++).该算法首先将变压器故障文本转换为批量化高维文本矩阵;其次,根据故障表述文本迭代改进中文BERT模型中关键权重参数,以获得全局语义向量.同时在迭代改进中,根据样本拟合的难易程度,Kbert模型对不同样本的识别损失值权重进行动态修正;最后,通过K-Means++算法,Kbert改进了原有单一 BERT模型难以处理单一故障文本包含多故障类型的不足.算例对全国782份真实变压器故障分析报告文本进行了故障类型识别.结果表明,所提出的Kbert模型克服了变压器故障描述文本距离长、样本种类分类不均导致的机器训练效果不佳的问题,性能指标F1值优于常用BERT和Bi-LSTM+Attention方法,实现了多种变压器故障信息的高准确率快速聚类识别.
文献关键词:
深度学习;变压器;故障类型识别;人工智能;自然语言处理;聚类分析
中图分类号:
作者姓名:
蒋晨;王渊;陈珉;李晨;王雅雯;马国明
作者机构:
华北电力大学新能源电力系统国家重点实验室,北京102206;国网浙江省电力有限公司,杭州310014
文献出处:
引用格式:
[1]蒋晨;王渊;陈珉;李晨;王雅雯;马国明-.基于Kbert文本聚类模型的变压器故障识别)[J].高电压技术,2022(08):2991-3000
A类:
Kbert,BERT+K,LSTM+Attention
B类:
文本聚类,聚类模型,变压器故障识别,故障分析,分析报告,设备故障,故障现象,描述语言,因人而异,自动判断,机器识别,识别算法,Means++,文本转换,高维,维文,迭代改进,全局语义,难易程度,损失值,动态修正,单一故障,多故障,故障类型识别,文本距离,本种,训练效果,Bi,故障信息,快速聚类,自然语言处理
AB值:
0.305196
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。