典型文献
基于知网的词语语义相似度改进算法研究
文献摘要:
词语语义相似度计算在很多自然语言处理相关领域都有着广泛应用.基于知网的现有词语语义相似度计算方法未深入考虑同棵义原层次树的义原距离、义原深度、义原密度及主次关系的影响,致使相似度计算结果并不够精确.针对该问题,提出一种词语语义相似度改进算法,通过分析知网中的义项表达式和义原层次树,用集合的加权平均值代替了义项相似度最大值,在新的边权重函数中引入义原密度,进而通过调节权重因子限制义原深度与义原密度对相似度计算准确度的影响.实验结果表明,改进后的算法有效提高了词语语义相似度准确率,取得了比较满意的结果,比现有方法更合理.
文献关键词:
知网;词语语义相似度;义原密度;义原深度
中图分类号:
作者姓名:
王辉;Marius.Petrescu;潘俊辉;王浩畅;张强
作者机构:
东北石油大学计算机与信息技术学院 大庆 163318;普洛耶什蒂石油天然气大学 普洛耶什蒂 100680
文献出处:
引用格式:
[1]王辉;Marius.Petrescu;潘俊辉;王浩畅;张强-.基于知网的词语语义相似度改进算法研究)[J].计算机与数字工程,2022(02):225-228,293
A类:
义原深度,义原密度
B类:
词语语义相似度,改进算法,算法研究,相似度计算,自然语言处理,未深,主次关系,义项,和义,加权平均值,边权重,权重函数,权重因子,制义,比较满意,更合
AB值:
0.169209
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。