首站-论文投稿智能助手
典型文献
融合汉字字形信息的文本关系抽取
文献摘要:
关系抽取任务旨在从文本中抽取实体对之间的关系,是当前自然语言处理领域的热门方向之一.由于中文具有复杂的句式和语法,导致现有的神经网络提取的特征以及语义表示能力较差,从而影响中文关系抽取的性能.汉字是象形文字,其字形结构在一定程度上隐含了字义,为此提出了包含字形级别实体表示的BERT_BI-GRU_Glyph模型.模型中选用基于转换器的双向编码表征(BERT)为预训练模型、双向门控循环单元(BI-GRU)获取句子上下文表示.实体由字级表示和实体字形级表示共同构成,在实体字形表示中嵌入了BERT、BERT_CNN和BERT_BI-GRU三种提取字形特征的策略来丰富实体语义信息.实验结果表明:所提出的模型在实体字形相似的关系抽取中性能更优.
文献关键词:
关系抽取;基于转换器的双向编码表征;双向门控循环单元;字形嵌入
作者姓名:
覃俊;廖立婷;刘晶;叶正;刘璐
作者机构:
中南民族大学 计算机科学学院 & 湖北省制造企业智能管理工程技术研究中心,武汉 430074
引用格式:
[1]覃俊;廖立婷;刘晶;叶正;刘璐-.融合汉字字形信息的文本关系抽取)[J].中南民族大学学报(自然科学版),2022(02):208-214
A类:
Glyph,字形嵌入
B类:
汉字字形,自然语言处理,文具,句式,语法,示能,中文关系抽取,象形文字,字形结构,字义,BERT,BI,GRU,基于转换器的双向编码表征,预训练模型,双向门控循环单元,句子,上下文,取字,富实,语义信息,形相
AB值:
0.275351
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。