首站-论文投稿智能助手
典型文献
基于语言模型词嵌入和注意力机制的敏感信息检测方法
文献摘要:
针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法.首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大地提高查询效率;其次,构建了一个语言模型词嵌入模型(ELMo)进行语境分析,并通过动态词向量充分表征语境特征,从而实现较高的可扩展性;最后,结合注意力机制加强模型对敏感特征的识别度,从而进一步提升对敏感信息的检测率.在由多个网络数据源构成的真实数据集上进行实验,结果表明,所提敏感信息检测方法与基于短语级情感分析的方法相比,准确率提升了13.3个百分点;与基于关键字匹配的方法相比,准确率提升了43.5个百分点,充分验证了所提方法在加强敏感特征识别度、提高敏感信息检测率方面的优越性.
文献关键词:
敏感信息;语言模型词嵌入;语境分析;注意力机制;字典树
作者姓名:
黄诚;赵倩锐
作者机构:
四川大学网络空间安全学院,成都610065
文献出处:
引用格式:
[1]黄诚;赵倩锐-.基于语言模型词嵌入和注意力机制的敏感信息检测方法)[J].计算机应用,2022(07):2009-2014
A类:
语言模型词嵌入
B类:
敏感信息,信息检测,字符,短语,情感分析,泛化性,ELMo,字典树,快速匹配,无用,用字,极大地提高,查询效率,词嵌入模型,语境分析,词向量,可扩展性,注意力机制加强,敏感特征,识别度,检测率,网络数据,数据源,真实数据,准确率提升,百分点,关键字,强敏感,特征识别
AB值:
0.310574
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。