首站-论文投稿智能助手
典型文献
基于ERNIE-DPCNN模型的地址清洗匹配方法研究
文献摘要:
大规模地址数据的词向量特征维度较高,导致地址清洗过程中存在一定的误差.为此,文章研究了基于ERNIE-DPCNN模型的地址清洗匹配方法.该方法利用数据准备层获取地址街道、POI等地址数据后,将其传输至逻辑计算层内;逻辑计算层使用ERNIE-DPCNN模型获取地址词向量特征,然后对该地址词向量特征进行地址分词匹配处理;将地址分词匹配结果输入到地址匹配引擎层内,生成行政区、街道等门牌索引;应用层使用Web服务器通过行政区、街道等门牌索引获取地址清洗匹配结果.实验结果表明:该方法可有效对地址数据字段进行清洗,最大程度地保留地址数据字段特征.该方法能在保证地址匹配结果较为精确的同时匹配到地址的行政区划分,应用效果较好.
文献关键词:
ERNIE-DPCNN模型;地址清洗匹配;词向量;向量维度;数据字段
作者姓名:
陈寅;马佳斌
作者机构:
长三角(嘉兴)城乡建设设计集团有限公司,浙江 嘉兴 314050
文献出处:
引用格式:
[1]陈寅;马佳斌-.基于ERNIE-DPCNN模型的地址清洗匹配方法研究)[J].地矿测绘,2022(04):7-11
A类:
地址清洗匹配
B类:
ERNIE,DPCNN,匹配方法,词向量,洗过,法利,数据准备,POI,逻辑计算,分词,地址匹配,成行,门牌,索引,应用层,服务器,数据字段,保留地,配到,行政区划,向量维度
AB值:
0.241076
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。