典型文献
基于CART决策树的活跃读者群体预测模型研究
文献摘要:
国家图书馆作为国家级公益性文化机构,拥有海量的馆藏资源和庞大的用户群体,多年来在资源建设、读者行为等方面积累了丰富的数据,基于这些重要数据进行科学预测非常有意义.从已有的读者信息和借阅数据中获取到与读者活跃度相关的所有特征,利用CART决策树构建了未来活跃读者群体的预测模型,并通过调参和剪枝等手段得到模型的最高得分.结果表明:读者ID、读者年龄、所借单册的分类号和出版社是影响读者活跃度的主要因子.该模型在5万条以上大样本数据量上呈现较好的预测能力,并通过交叉验证可以稳定模型的平均准确程度,避免了训练样本的随机性.
文献关键词:
图书馆;活跃读者;CART决策树;预测模型
中图分类号:
作者姓名:
只莹莹
作者机构:
中国国家图书馆,北京,100081
文献出处:
引用格式:
[1]只莹莹-.基于CART决策树的活跃读者群体预测模型研究)[J].图书情报导刊,2022(08):71-77
A类:
活跃读者
B类:
CART,决策树,读者群体,国家图书馆,公益性,文化机构,馆藏资源,用户群体,资源建设,重要数据,读者信息,借阅数据,取到,活跃度,剪枝,ID,分类号,万条,大样本,数据量,预测能力,交叉验证,稳定模型,训练样本,随机性
AB值:
0.37065
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。