典型文献
一种使用RoBERTa-BiLSTM-CRF 的中文地址解析方法
文献摘要:
针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果.通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的Fi值.所提出的方法在泛化能力测试集上的F1值达到了 0.940,在普通测试集上的F1值达到了 0.968.
文献关键词:
地址解析;中文地址分词;注意力机制;长短时记忆网络;RoBERTa;BiLSTM;CRF
中图分类号:
作者姓名:
张红伟;杜清运;陈张建;张琛
作者机构:
武汉大学电子信息学院,湖北 武汉,430072;武汉大学资源与环境科学学院,湖北 武汉,430079;浙江省测绘科学技术研究院,浙江 杭州,311100
文献出处:
引用格式:
[1]张红伟;杜清运;陈张建;张琛-.一种使用RoBERTa-BiLSTM-CRF 的中文地址解析方法)[J].武汉大学学报(信息科学版),2022(05):665-672
A类:
中文地址分词
B类:
RoBERTa,BiLSTM,CRF,地址解析,解析方法,地址匹配,匹配方法,词典,使用深度,构成分析,词向量,向量表示,序列标注,对比评估,递归,双向长短时记忆网络,稀疏注意力,注意力机制,Fi,泛化能力,测试集
AB值:
0.282107
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。