典型文献
基于命名实体n-gram图的文本相似性度量
文献摘要:
文本比较在自然语言处理中应用广泛.本文提出了一种新的文本相似性度量方法,该方法利用从文本和n-gram图中提取的命名实体信息来表示文档,使用OpenCalais作为命名实体识别服务,使用JIn?sect工具箱来构造和管理n-gram,使用文本聚类算法k-Means进行文本相似性度量,使用各种聚类有效性指标对生成的聚类进行评估.
文献关键词:
自然语言处理;n-gram图;文本聚类;文本相似性度量
中图分类号:
作者姓名:
于营;周显春;贾树文
作者机构:
三亚学院信息与智能工程学院,三亚 572000;三亚学院容淳铭院士工作站,三亚 572000;三亚学院盛宝金融科技商学院,三亚 572000
文献出处:
引用格式:
[1]于营;周显春;贾树文-.基于命名实体n-gram图的文本相似性度量)[J].现代计算机,2022(02):73-77
A类:
文本相似性度量,OpenCalais,JIn
B类:
gram,自然语言处理,法利,实体信息,文档,命名实体识别,sect,工具箱,文本聚类,聚类算法,Means,聚类有效性指标
AB值:
0.184246
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。