首站-论文投稿智能助手
典型文献
融入领域术语词典的司法舆情敏感信息识别
文献摘要:
司法舆情敏感信息识别主要是从海量网络文本中识别出与司法领域相关的敏感舆情.当前,面向司法舆情敏感信息识别的研究较少,相比通用领域的敏感信息识别任务,司法舆情敏感信息具有描述不规范、冗余信息多以及领域词汇过多等特点,这使得通用模型并不适用该任务.为此,该文提出融入领域术语词典的司法舆情敏感信息识别模型.首先使用双向循环神经网络和多头注意力机制对舆情文本进行编码,得到具有权重信息的文本表示;其次将领域术语词典作为分类的指导知识,与舆情文本表征构建相似矩阵,得到融入领域术语词典的司法敏感文本表征;然后利用卷积神经网络对其进行局部信息编码,再利用多头注意力机制获取具有敏感权重的局部特征;最后实现司法领域敏感信息识别.实验结果表明,相比Bi-LSTM Attention基线模型,F1值提升了8%.
文献关键词:
司法舆情;敏感信息;领域术语词典;多头注意力机制
作者姓名:
张泽锋;毛存礼;余正涛;黄于欣;刘奕洋
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500;昆明理工大学 云南省人工智能重点实验室,云南 昆明 650500
文献出处:
引用格式:
[1]张泽锋;毛存礼;余正涛;黄于欣;刘奕洋-.融入领域术语词典的司法舆情敏感信息识别)[J].中文信息学报,2022(09):76-83,92
A类:
领域术语词典,司法舆情,敏感信息识别,敏感舆情
B类:
网络文本,司法领域,冗余信息,领域词,通用模型,识别模型,双向循环神经网络,多头注意力机制,舆情文本,重信,文本表示,将领,文本表征,相似矩阵,局部信息,信息编码,局部特征,Bi,Attention,基线模型
AB值:
0.153001
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。