典型文献
基于随机森林和关键词查询扩展的医学文献推荐方法
文献摘要:
[目的]从大量医学文献中发现有价值的内容以帮助临床医生做出诊断,提高医学文献推荐效果.[方法]基于随机森林模型与关键词查询扩展相结合的新方法,利用MeSH词典和自动构建的首字母缩略词词典,在句子、段落、文档三个层次上建立关键词与相应文章的完整关系,计算主题与文章之间的多重相似度,对于每篇文章通过文献集合中的引文网络计算HITS的PageRank权重和Authority权重.[结果]与TREC临床决策支持跟踪评价结果中NDCG@100最高的10个值的平均值相比,本文方法NDCG@100的总体平均值差距在0.9%以内,差距极小.[局限]由于某些新文献或"睡美人"文献前期引用较低,可能会出现检索排名靠后,在此类情况下,本文方法无法进行精准推荐.[结论]通过计算主题与文章之间相似点和引文关系的权重,利用随机森林方法对查询扩展结果进行重新排序,可以有效提高医学文献推荐的效果.
文献关键词:
文献推荐;临床决策支持;随机森林;关键词查询扩展
中图分类号:
作者姓名:
丁浩;胡广伟;齐江蕾;庄光光
作者机构:
南京大学信息管理学院 南京 210023;南京大学政务信息资源研究所 南京 210023;南京财经大学信息工程学院 南京 210023
文献出处:
引用格式:
[1]丁浩;胡广伟;齐江蕾;庄光光-.基于随机森林和关键词查询扩展的医学文献推荐方法)[J].数据分析与知识发现,2022(07):32-43
A类:
关键词查询扩展
B类:
医学文献,文献推荐,推荐方法,临床医生,出诊,高医,推荐效果,随机森林模型,MeSH,词典,自动构建,首字母,缩略词,句子,段落,文档,每篇,篇文章,引文网络,HITS,PageRank,Authority,TREC,临床决策支持,跟踪评价,NDCG,均值差,极小,睡美人,此类情况,精准推荐,相似点,随机森林方法
AB值:
0.372841
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。