典型文献
基于ALBERT预训练模型的通用中文命名实体识别方法
文献摘要:
HMM、CRF等机器学习算法在中文实体抽取任务上存在大量依靠特征提取及准确率低的缺陷,而基于BiL-STM-CRF、BERT等深度神经网络算法在中文实体识别准确率高,但BiLSTM模型依赖大规模标注数据,BERT存在参数量大、效率低等问题.该研究提出了基于ALBERT-Attention-CRF模型进行中文实体抽取的方法.首先将glove、Word2vec等静态词向量替换为ALBERT预训练模型字向量,可有效解决分词错误、数据稀疏、OOV、过拟合以及一词多义等问题;然后采用ALBERT作为编码层并对其输出利用Attention机制捕获上下文语义特征;最后结合CRF作为解码层输出实体正确标签,摒弃主流BiLSTM-CRF模型,最终在《人民日报》数据的测试集上取得了理想的效果.试验结果表明,该方法有助于提升通用中文实体识别的准确率和效率,其有效性也得到了较好的验证.
文献关键词:
命名实体识别;条件随机场;BERT模型;ALBERT模型;准确率
中图分类号:
作者姓名:
吕海峰;冀肖榆;陈伟业;邸臻炜
作者机构:
梧州学院 大数据与软件工程学院,广西 梧州 543002;梧州学院 广西机器视觉与智能控制重点实验室,广西 梧州 543002;梧州学院 广西高校图像处理与智能信息系统重点实验室,广西 梧州 543002
文献出处:
引用格式:
[1]吕海峰;冀肖榆;陈伟业;邸臻炜-.基于ALBERT预训练模型的通用中文命名实体识别方法)[J].梧州学院学报,2022(03):10-17
A类:
B类:
ALBERT,预训练模型,中文命名实体识别,实体识别方法,HMM,CRF,机器学习算法,实体抽取,深度神经网络,神经网络算法,识别准确率,BiLSTM,参数量,Attention,glove,Word2vec,词向量,字向量,分词,数据稀疏,OOV,过拟合,一词多义,编码层,上下文语义,语义特征,解码,摒弃,人民日报,测试集,条件随机场
AB值:
0.338184
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。