典型文献
基于匹配策略和社区注意力机制的法律文书命名实体识别
文献摘要:
根据司法案件文书中实体名长度较长以及实体间的关联性较强这一特点,该文提出了一种利用最大正向匹配策略和社区注意力机制(FMM-CAM)的法律文书命名实体识别方法.该方法利用最大正向匹配策略,优先获得法律文书中每个字对应的较长的匹配词,将匹配词按字在词中的位置划分到B、M、E、S四个匹配词社区,并利用社区自注意力机制获取不同匹配词之间的关联性权重信息.具体过程利用BERT和Word2Vec的字表示,将字和匹配词社区压缩后的匹配词进行向量拼接,输入到一个BiLSTM中获得句子的语义表示,再利用CRF将句子进行解码,得到最优标签序列.实验结果表明,该文提出的方法可以对法律文书中的证据名、证实内容和卷宗号等实体边界进行有效确定.
文献关键词:
法律文书;命名实体识别;自注意力;BiLSTM
中图分类号:
作者姓名:
郭力华;李旸;王素格;陈鑫;符玉杰;裴文生
作者机构:
山西大学 计算机与信息技术学院,山西 太原 030006;山西财经大学 金融学院,山西 太原 030006;山西大学 计算智能与中文信息处理教育部重点实验室,山西 太原 030006;北京市律典通科技有限公司,山西 太原 030006
文献出处:
引用格式:
[1]郭力华;李旸;王素格;陈鑫;符玉杰;裴文生-.基于匹配策略和社区注意力机制的法律文书命名实体识别)[J].中文信息学报,2022(02):85-92
A类:
关联性权重
B类:
匹配策略,法律文书,命名实体识别,司法案件,大正,FMM,CAM,实体识别方法,法利,得法,分到,自注意力机制,重信,BERT,Word2Vec,行向量,向量拼接,BiLSTM,句子,CRF,解码,卷宗
AB值:
0.301333
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。