典型文献
基于分层标注的中文嵌套命名实体识别
文献摘要:
中文命名实体识别在中文信息处理中扮演着重要的角色.在中文信息文本中,许多命名实体内部包含着嵌套实体.然而,已有研究大多聚焦在非嵌套实体识别,无法充分捕获嵌套实体之间的边界信息.采用分层标注方式进行嵌套命名实体识别(nested named entity recognition,NNER),将每层的实体识别解析为一个单独的任务,并通过Gate过滤机制来促进层级之间的信息交换.利用公开的1998年《人民日报》NNER语料进行了多组实验,验证了模型的有效性.实验结果表明,在不使用外部资源词典信息的情况下,该方法在《人民日报》数据集上的F1值达到了 91.41%,有效提高了中文嵌套命名实体识别的效果.
文献关键词:
中文信息处理;分层标注;嵌套命名实体识别;Gate过滤机制
中图分类号:
作者姓名:
金彦亮;谢晋飞;吴迪嘉
作者机构:
上海大学通信与信息工程学院,上海200444
文献出处:
引用格式:
[1]金彦亮;谢晋飞;吴迪嘉-.基于分层标注的中文嵌套命名实体识别)[J].上海大学学报(自然科学版),2022(02):270-280
A类:
分层标注,NNER
B类:
嵌套命名实体识别,中文命名实体识别,中文信息处理,多聚焦,非嵌套,嵌套实体识别,nested,named,entity,recognition,每层,Gate,过滤机制,信息交换,人民日报,语料,不使用,外部资源,源词,词典
AB值:
0.20151
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。