基于CNN⁃Head Transformer编码器的中文命名实体识别|史占堂;马玉鹏;赵凡;马博|中国科学院大学,北京 100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于CNN⁃Head Transformer编码器的中文命名实体识别

文献摘要：

基于多头自注意力机制的Transformer作为主流特征提取器在多种自然语言处理任务中取得了优异表现,但应用于命名实体识别任务时存在一字多词、增加额外存储与词典匹配时间等问题.提出一种CNN-Head Transformer编码器(CHTE)模型,在未使用外部词典和分词工具的基础上,通过自注意力机制捕获全局语义信息,利用不同窗口大小的CNN获取Transformer中6个注意力头的Value向量,使CHTE模型在保留全局语义信息的同时增强局部特征和潜在词信息表示,并且应用自适应的门控残差连接融合当前层和子层特征,提升了Transformer在命名实体识别领域的性能表现.在Weibo和Resume数据集上的实验结果表明,CHTE模型的F1值相比于融合词典信息的Lattice LSTM和FLAT模型分别提升了3.77、2.24和1.30、0.31个百分点,具有更高的中文命名实体识别准确性.

文献关键词：

命名实体识别;自注意力机制;Transformer编码器;卷积神经网络;残差连接

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

史占堂;马玉鹏;赵凡;马博

作者机构：

中国科学院新疆理化技术研究所,乌鲁木齐 830011;中国科学院大学,北京 100049;新疆民族语音语言信息处理实验室,乌鲁木齐 830011

文献出处：

计算机工程

引用格式：

[1]史占堂;马玉鹏;赵凡;马博-.基于CNN⁃Head Transformer编码器的中文命名实体识别)[J].计算机工程,2022(10):73-80

A类：

CHTE

B类：

Head,Transformer,编码器,中文命名实体识别,多头自注意力机制,自然语言处理,一字,增加额,外存,词典,匹配时间,分词,全局语义信息,同窗,Value,局部特征,词信息,门控残差,残差连接,Weibo,Resume,Lattice,FLAT,百分点

AB值：

0.235037

相似文献

中文命名实体识别综述

赵山;罗睿;蔡志平-国防科技大学计算机学院,长沙 410073

命名实体识别方法研究综述

李冬梅;罗斯斯;张小平;许福-北京林业大学信息学院,北京 100083;国家林业和草原局林业智能信息处理工程技术研究中心,北京 100083;中国中医科学院中医药信息研究所,北京 100700

融合多语义特征的命名实体识别方法

左亚尧;陈皓宇;陈致然;洪嘉伟;陈坤-广东工业大学计算机学院,广州510006

基于知识库实体增强BERT模型的中文命名实体识别

胡婕;胡燕;刘梦赤;张龑-湖北大学计算机与信息工程学院,武汉 430062;华南师范大学计算机学院,广州 510631

基于深度自编码的医疗命名实体识别模型

侯旭东;滕飞;张艺-西南交通大学计算机与人工智能学院,成都611756

基于匹配策略和社区注意力机制的法律文书命名实体识别

郭力华;李旸;王素格;陈鑫;符玉杰;裴文生-山西大学计算机与信息技术学院,山西太原 030006;山西财经大学金融学院,山西太原 030006;山西大学计算智能与中文信息处理教育部重点实验室,山西太原 030006;北京市律典通科技有限公司,山西太原 030006

基于两段高速网络的命名实体识别

陈淳;李明扬;孔芳-苏州大学计算机科学与技术学院,江苏苏州 215006

基于多颗粒度文本表征的中文命名实体识别方法

田雨;张桂平;蔡东风;陈华威;宋彦-沈阳航空航天大学人机智能研究中心,辽宁沈阳 110136;香港中文大学(深圳)数据科学学院,广东深圳 518172

基于深度学习的中文命名实体识别最新研究进展综述

张汝佳;代璐;王邦;郭鹏-华中科技大学电子信息与通信学院,湖北武汉430074

面向教育领域的基于SVR-BiGRU-CRF中文命名实体识别方法

张召武;徐彬;高克宁;王同庆;张乔乔-东北大学计算机科学工程学院,辽宁沈阳110179

基于多级别特征感知网络的中文命名实体识别

宋威;周俊昊-江南大学人工智能与计算机学院,江苏无锡 214122;江南大学江苏省模式识别与计算智能工程实验室,江苏无锡 214122

多头注意力与字词融合的中文命名实体识别

赵丹丹;黄德根;孟佳娜;谷丰;张攀-大连理工大学计算机科学与技术学院,辽宁大连 116024;大连民族大学计算机科学与工程学院,辽宁大连 116600

门控多特征提取器的中文命名实体识别

杨荣莹;何庆;杜逆索-贵州大学大数据与信息工程学院,贵阳 550025;贵州大学贵州省公共大数据重点实验室,贵阳 550025;贵州大学贵州省大数据产业发展应用研究院,贵阳 550025

面向科技学术会议的命名实体识别研究

于润羽;杜军平;薛哲;徐欣;奚军庆-北京邮电大学智能通信软件与多媒体北京市重点实验室, 北京 100876;司法部信息中心, 北京 100020

融合字根信息的卷积神经网络中文分词方法

王星;于丽美;陈吉-辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105

面向中文命名实体识别任务的数据增强

李健;张克亮;唐亮;夏榕璟;任静静-战略支援部队信息工程大学,河南洛阳 471003

基于多任务学习的电子病历实体识别方法

于鹏;陈钰枫;徐金安;张玉洁-北京交通大学计算机与信息技术学院,北京 100044

融合ERNIE与改进Transformer的中文NER模型

罗峦;夏骄雄-上海理工大学光电信息与计算机工程学院,上海 200093

面向时钟领域的BERT-LCRF命名实体识别方法

唐焕玲;王慧;隗昊;赵红磊;窦全胜;鲁明羽-山东工商学院计算机科学与技术学院,山东烟台 264005;山东省高等学校协同创新中心:未来智能计算,山东烟台 264005;山东省高校智能信息处理重点实验室(山东工商学院),山东烟台 264005;山东工商学院信息与电子工程学院,山东烟台 264005;大连海事大学信息科学技术学院,辽宁大连 116026

结合gazetteers和句法依存树的中文命名实体识别

方红;苏铭;冯一铂;张澜-上海第二工业大学文理学部,上海 201209;上海第二工业大学工学部,上海 201209;喀什大学数学与统计学院,新疆喀什 844000

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。