首站-论文投稿智能助手
典型文献
基于文本特征增强的电力命名实体识别
文献摘要:
针对电力领域语料规模小、实体嵌套、实体缩写等特点,提出基于文本特征增强的实体识别方法.首先,通过预设词库和低粒度分词的方式,在合理利用中文单词蕴含的语义信息的同时,降低分词传递误差的影响.其次,设计词级双向门控循环单元学习中文单词构造特征,融合词性和词长特征后,与单词向量拼接成为单词增强向量.然后,基于双向门控循环单元-注意力机制-条件随机场完成实体识别模型的构建和训练.在此基础上,采用电力领域语料库进行验证,F1分数为87.02%,证实了电力命名实体识别效果.
文献关键词:
电力实体识别;低粒度分词;单词构造特征;词级双向门控循环单元
作者姓名:
刘文松;胡竹青;张锦辉;刘雪菁;林峰;俞俊
作者机构:
南瑞集团有限公司(国网电力科学研究院有限公司),江苏省南京市 211106;江苏瑞中数据股份有限公司,江苏省南京市 211106
文献出处:
引用格式:
[1]刘文松;胡竹青;张锦辉;刘雪菁;林峰;俞俊-.基于文本特征增强的电力命名实体识别)[J].电力系统自动化,2022(21):134-142
A类:
低粒度分词,词级双向门控循环单元,单词构造特征
B类:
文本特征,特征增强,命名实体识别,电力领域,语料规模,实体嵌套,缩写,实体识别方法,词库,语义信息,传递误差,单元学习,词性,词长,长特,词向量,向量拼接,注意力机制,条件随机场,识别模型,语料库,电力实体识别
AB值:
0.275169
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。