首站-论文投稿智能助手
典型文献
基于机器阅读理解的BiLSTM-BiDAF命名实体识别
文献摘要:
命名实体识别是自然语言处理的一项基本任务,对信息提取、机器翻译等具有重要的意义和价值.目前命名实体识别通常使用序列标注方法对文本中单个句子的实体进行抽取,忽略了句子间的语义信息.基于机器阅读理解的命名实体识别方法借助问题编码了实体类别的重要先验信息,更加容易区分出相似的分类标签,降低了模型学习难度,但仍然只在句子级别建模,忽略了句子间的语义信息,容易造成不同句子中实体标注不一致的问题.为此,文中将句子级别的命名实体识别扩展到文本级别的命名实体识别,提出了一种基于机器阅读理解的BiLSTM-BiDAF命名实体识别模型.首先,为了充分挖掘文本的上下文特征,使用NEZHA获取全文语境信息,并进一步通过BiLSTM提取局部特征,以加强模型对局部依赖信息的捕获能力;然后,引入双向注意力机制学习文本与实体类别之间的语义关联;最后,设计基于门控机制的边界检测器加强实体边界的相关关系,预测出实体在文本中的位置,同时通过建立答案数量检测器,将无答案问题识别出来.在CCKS2020中文电子病历数据集和CMeEE数据集上的实验结果表明,文中构建的模型能有效地识别文本中的命名实体,F1值可分别达到84.76%和57.35%.
文献关键词:
双向注意力机制;双向长短时记忆网络;命名实体识别;机器阅读理解;自然语言处理
作者姓名:
王洁;夏晓明
作者机构:
北京工业大学 信息学部,北京 100124
引用格式:
[1]王洁;夏晓明-.基于机器阅读理解的BiLSTM-BiDAF命名实体识别)[J].华南理工大学学报(自然科学版),2022(12):80-88
A类:
BiDAF,CMeEE
B类:
机器阅读理解,BiLSTM,命名实体识别,自然语言处理,基本任务,信息提取,机器翻译,序列标注,标注方法,语义信息,实体识别方法,问题编码,实体类别,先验信息,分出,模型学习,学习难度,句子级,实体标注,本级,识别模型,上下文特征,NEZHA,局部特征,对局,获能,双向注意力机制,学习文本,语义关联,门控机制,边界检测,检测器,预测出,数量检测,问题识别,CCKS2020,中文电子病历,历数,双向长短时记忆网络
AB值:
0.264744
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。