典型文献
基于随机森林的深圳二手房价格分析
文献摘要:
文章通过网络爬虫技术从链家网站上爬取与深圳二手房在售房源相关的15个特征变量的数据集,构建基于随机森林算法的预测模型.为提高模型预测精度,首先借助于交叉验证和网格搜索技术对随机森林模型的相关参数进行寻优,并在此基础上对房价进行预测.结果表明,该模型在训练集上的R2为97.5%,在测试集上的R2为87.5%,预测性能较好.进一步通过分析各特征变量对房价的影响程度发现,建筑面积、房屋户型和所在区域对房价的影响较大,而其余特征变量对房价的影响相对较小,该结论的得出可为后续研究奠定基础.
文献关键词:
随机森林;深圳二手房价格;网络爬虫
中图分类号:
作者姓名:
周亮锦;赵明扬
作者机构:
韩山师范学院 经济与管理学院 金融大数据中心, 广东 潮州 521000;韩山师范学院 数学与统计学院, 广东 潮州 521000
文献出处:
引用格式:
[1]周亮锦;赵明扬-.基于随机森林的深圳二手房价格分析)[J].中国市场,2022(26):68-71,133
A类:
深圳二手房价格
B类:
价格分析,网络爬虫技术,站上,上爬,爬取,售房,房源,特征变量,随机森林算法,先借,借助于,交叉验证,网格搜索,随机森林模型,训练集,测试集,预测性能,建筑面积,户型,所在区域
AB值:
0.274926
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。