典型文献
基于Attention-BIGRU-CRF的中文分词模型
文献摘要:
自然语言处理是人工智能发展的重要分支,而中文分词是自然语言处理的第一步,提高中文分词的效率可以提高自然语言处理的结果的准确性.因此提出一种Attention-BIGRU-CRF模型,首先将中文文本通过词向量转换,将文本转换成向量的形式,再利用BIGRU进行序列化学习,随后引入attention机制将BIGRU的输入和输出进行相关性计算获取更精确向量值,最后将该向量值与BIGRU序列化得到的向量值进行拼接作为CRF层的输入并得到标签预测结果.由仿真结果可知,Attention-BIGRU-CRF模型在人民日报2014和MSRA的语料库得到的F1值分别为97.34%和98.25%,处理文本的分词速率为248.1 KB/s.故融合attention机制和BIGRU-CRF网络的模型既能够提高分词准确率,又能提高分词时间和效率.
文献关键词:
自然语言处理;双向门控循环单元;条件随机场;注意力机制;中文分词
中图分类号:
作者姓名:
周慧;徐名海;许晓东
作者机构:
南京邮电大学通信与信息工程学院,江苏 南京 210003
文献出处:
引用格式:
[1]周慧;徐名海;许晓东-.基于Attention-BIGRU-CRF的中文分词模型)[J].计算机与现代化,2022(08):7-12,19
A类:
B类:
Attention,BIGRU,CRF,中文分词,自然语言处理,人工智能发展,第一步,中文文本,词向量,文本转换,转换成,序列化,attention,出进,拼接,人民日报,MSRA,语料库,KB,双向门控循环单元,条件随机场,注意力机制
AB值:
0.267366
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。