首站-论文投稿智能助手
典型文献
基于伪语义相似度模型的中文地址匹配方法
文献摘要:
地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高.为解决上述问题,本文首先应用基于条件随机场和双向长短时记忆神经网络的模型,对地址进行分词;然后通过建立一种伪语义相似度,对地址要素进行分级匹配.通过对公安业务中地址数据进行测试,在对缩写、简写等不规范地址描述方面,本文模型能较理想地完成任务,各参考指标均高于0.9.
文献关键词:
条件随机场和双向长短时记忆神经网络;地址要素解析;伪语义相似度;地址匹配;地址标准化
作者姓名:
郁汀;王铎;陈钦
作者机构:
公安部第三研究所,上海200031;复旦大学,上海200433
文献出处:
引用格式:
[1]郁汀;王铎;陈钦-.基于伪语义相似度模型的中文地址匹配方法)[J].测绘通报,2022(03):101-106
A类:
伪语义相似度,条件随机场和双向长短时记忆神经网络,地址要素解析,地址标准化
B类:
相似度模型,中文地址匹配,匹配方法,字符,简写,缩写,误匹配,匹配问题,深度学习方法,数据量,分词,公安,安业,较理想,完成任务
AB值:
0.168535
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。