典型文献
非均权-动态规划地址匹配算法设计与实现
文献摘要:
传统的地址匹配方法往往难以胜任中文地址匹配问题.首先,每个中文单字都是独立整体,在纠错上难度大于英文,其次中文地址体系结构复杂,缺乏一个统一的标准.本文结合生物信息领域的序列比对思想,提出了一种基于动态规划的中文地址匹配方法.该方法将中文单字看成字符单元,对中文地址进行序列化,改进Smith-waterman算法进行序列匹配.针对中文的单字特点,统计区分文字的重要性差异,构建非均权打分策略;引入空分罚分策略,解决错误匹配及其过度拟合问题;使用排序均一化策略,优化了排序效率,增加了结果集的多样性.最后,将本算法应用于杭州市实际路网(1∶30万),实验结果表明,该算法可以有效提升中文地址匹配精度.
文献关键词:
动态规划;中文地址匹配;地址树;空位罚分;置换矩阵;序列比对
中图分类号:
作者姓名:
徐嘉康;张晨;王柳静;张贵军
作者机构:
浙江工业大学信息工程学院,杭州310023
文献出处:
引用格式:
[1]徐嘉康;张晨;王柳静;张贵军-.非均权-动态规划地址匹配算法设计与实现)[J].小型微型计算机系统,2022(03):530-535
A类:
waterman,地址树,空位罚分
B类:
均权,动态规划,划地,匹配算法,算法设计与实现,匹配方法,中文地址匹配,匹配问题,单字,纠错,体系结构,序列比对,看成,字符,序列化,Smith,序列匹配,分文,打分,误匹配,过度拟合,均一化,排序效率,算法应用,杭州市,路网,匹配精度,置换矩阵
AB值:
0.298473
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。