首站-论文投稿智能助手
典型文献
基于多颗粒度文本表征的中文命名实体识别方法
文献摘要:
中文命名实体识别常使用字符嵌入作为神经网络模型的输入,但是中文没有明确的词语边界,字符嵌入的方法会导致部分语义信息的丢失.针对此问题,该文提出了一种基于多颗粒度文本表征的中文命名实体识别模型.首先,在模型输入端结合了字词表征,然后借助N-gram编码器挖掘N-gram中潜在的成词信息,有效地联合了三种不同颗粒度的文本表征,丰富了序列的上下文表示.该文在Weibo、Resume和OntoNotes4数据集上进行了实验,实验结果的F1值分别达到了72.41%、96.52%、82.83%.与基准模型相比,该文提出的模型具有更好的性能.
文献关键词:
中文命名实体识别;多颗粒度文本表征;N-gram
作者姓名:
田雨;张桂平;蔡东风;陈华威;宋彦
作者机构:
沈阳航空航天大学 人机智能研究中心,辽宁 沈阳 110136;香港中文大学(深圳)数据科学学院,广东 深圳 518172
文献出处:
引用格式:
[1]田雨;张桂平;蔡东风;陈华威;宋彦-.基于多颗粒度文本表征的中文命名实体识别方法)[J].中文信息学报,2022(04):90-99
A类:
多颗粒度文本表征,成词信息,OntoNotes4
B类:
中文命名实体识别,实体识别方法,用字,字符,词语,法会,部分语义,语义信息,识别模型,模型输入,字词,词表,gram,编码器,上下文,Weibo,Resume
AB值:
0.167023
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。