首站-论文投稿智能助手
典型文献
基于XGBoost的房价预测优化
文献摘要:
客观来说,房价受到诸多因素的制约,正因如此,房价预测仍然是数据分析中一个非常经典且具有挑战性的问题.本文针对房价数据冗余,在实际场景中很难确定重要特征,提出了 一种创新的数据预处理方式,并通过双模型迭代拟合的方式进行数据预测.首先从数据意义、数据形式和数据关联性三个方面进行初始数据预处理,然后根据数据选择适合的模型进行训练.在传统机器学习中,Random Forest和XGBoost是两种常用的方法.RF模型通过其Bagging过程,能够准确地评判"冗余"特征,而XGB模型在提高预测效果的同时,也囿于其泛化能力下降,无法稳定地反映特征重要性.因此,本文利用RF模型处理冗余数据,并使用XGB模型对新数据集进行拟合提高预测效果.本文在Kaggle竞赛的数据集("House Prices-Advanced Regression Techniques")上进行了实验,测试结果显示,XGB回归模型最终的回归精度R2为87%,而单独的RF模型或XGB模型的R2分别为79.2%和78.7%.实验证明,该数据预测方法能够明显提高房价预测效果.同时,为充分体现模型拟合效果和预测能力,将"房价"改为具有"高"和"低"两类的离散变量,最终预测结果的精确度为93%,召回率为93%.
文献关键词:
房价预测;机器学习;XGBoost;Random Forest;模型迭代回归
作者姓名:
陶然
作者机构:
奥克兰大学,奥克兰99030
引用格式:
[1]陶然-.基于XGBoost的房价预测优化)[J].四川大学学报(自然科学版),2022(03):181-198
A类:
模型迭代回归
B类:
XGBoost,房价预测,正因如此,数据冗余,数据预处理,预处理方式,双模型,迭代拟合,数据预测,数据关联性,数据选择,Random,Forest,RF,Bagging,囿于,泛化能力,特征重要性,模型处理,冗余数据,新数据,Kaggle,House,Prices,Advanced,Regression,Techniques,高房价,模型拟合,拟合效果,预测能力,离散变量,召回率
AB值:
0.379564
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。