典型文献
融合信息熵的TextRank关键词抽取方法
文献摘要:
将信息熵融入TextRank算法中分词器部分以改善关键词抽取的准确度.在分词前,先用信息熵的方式提取文章的关键新词,加入到分词字典中,使分词器能够自主识别新词,以增强文章关键词提取的准确性.当语料中存在新词的时候,关键词抽取准确度效果提升明显,对不存在新词的语料关键词抽取准确度无明显提升.改善分词效果可以提升关键词抽取准确度.
文献关键词:
抽取;信息熵;TextRank
中图分类号:
作者姓名:
于腊梅;杨良斌
作者机构:
国际关系学院信息科技学院 北京 100091
文献出处:
引用格式:
[1]于腊梅;杨良斌-.融合信息熵的TextRank关键词抽取方法)[J].计算机与数字工程,2022(03):516-519,579
A类:
B类:
融合信息,信息熵,TextRank,关键词抽取,分词器,先用,新词,字典,自主识别,关键词提取,语料,效果提升,提升关键
AB值:
0.322065
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。