典型文献
基于刑事Electra的编-解码关系抽取模型
文献摘要:
针对司法领域关系抽取任务中模型对句子上下文理解不充分、重叠关系识别能力弱的问题,提出了一种基于刑事Electra(CriElectra)的编-解码关系抽取模型.首先,参考中文Electra的训练方法,在1000000份刑事数据集上训练得到了CriElectra;然后,在双向长短期记忆网络(BiLSTM)模型上加入CriElectra的词特征进行司法文本的特征提取;最后,通过胶囊网络(CapsNet)对特征进行矢量聚类,从而实现实体间的关系抽取.实验结果表明,在自构建的故意伤害罪关系数据集上,与基于中文Electra的这一预训练语言模型相比,CriElectra在司法文本上的重训过程使得学习到的词向量蕴含更丰富的领域信息,且F1值提升了1.93个百分点;与基于池化聚类的模型相比,CapsNet通过矢量运算能够有效防止空间信息丢失,并提高重叠关系的识别能力,使得F1值提升了3.53个百分点.
文献关键词:
司法领域;关系抽取;预训练语言模型;双向长短期记忆网络;胶囊网络
中图分类号:
作者姓名:
王小鹏;孙媛媛;林鸿飞
作者机构:
大连理工大学计算机科学与技术学院,辽宁大连116024
文献出处:
引用格式:
[1]王小鹏;孙媛媛;林鸿飞-.基于刑事Electra的编-解码关系抽取模型)[J].计算机应用,2022(01):87-93
A类:
CriElectra
B类:
刑事,解码,关系抽取,取模,司法领域,对句,句子,上下文,文理,关系识别,识别能力,考中,训练方法,练得,双向长短期记忆网络,BiLSTM,词特征,法文本,胶囊网络,CapsNet,故意伤害罪,关系数据,预训练语言模型,训过,词向量,域信息,百分点,池化,矢量运算,空间信息,信息丢失
AB值:
0.29566
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。