典型文献
针对中文分词的带标签注意力的成词记忆网络
文献摘要:
成词信息是一种对中文分词任务十分重要的文本特征.最新中文分词模型之一的WMSEG就是通过 引入成词信息来获得最顶尖的分词性能.然而这类模型在建模时并未考虑标签之间的依赖关系,导致其分词性能特别是对未登录词的识别有所欠缺.针对这一问题,通过在学习过程中引入标签嵌入的注意力机制,提出了一种带标签注意力的成词记忆网络来增强标签之间的依赖关系以及标签和字符之间的相关性.实验结果表明,该模型在四个常用数据集上都取得了不弱于WMSEG的分词性能,同时提高了对未登录词的识别能力.
文献关键词:
成词信息;中文分词;标签嵌入;注意力机制;未登录词
中图分类号:
作者姓名:
韩士洋;马致远;杨芳艳;李想;汪伟
作者机构:
上海理工大学机器智能研究院,上海200093;上海理工大学机械工程学院,上海200093;南京大学计算机软件新技术国家重点实验室,南京210093;上海理工大学光电信息与计算机工程学院,上海200093
文献出处:
引用格式:
[1]韩士洋;马致远;杨芳艳;李想;汪伟-.针对中文分词的带标签注意力的成词记忆网络)[J].计算机应用研究,2022(06):1651-1655
A类:
成词信息,WMSEG
B类:
中文分词,标签注意力,记忆网络,文本特征,顶尖,词性,依赖关系,未登录词,所欠,学习过程,标签嵌入,注意力机制,字符,不弱,识别能力
AB值:
0.204645
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。