典型文献
大数据岭回归的最优子抽样
文献摘要:
针对大数据岭回归问题,研究了提升计算效率的子抽样方法.现有子抽样方法的研究主要集中于没有惩罚项的模型框架,而相较于普通最小二乘估计,岭回归中惩罚项的引入权衡了估计的偏差和方差.通过子样本所得估计的渐近性质研究,本文提出了以渐近均方误差为优化准则的岭回归最优子抽样估计,并计算得到包含岭杠杆值和L2范数的子抽样概率,对岭杠杆值的计算使用近似方法后,得到计算成本较低的算法.
文献关键词:
大数据;岭回归;子抽样方法;岭杠杆值
中图分类号:
作者姓名:
陈云璐;张楠
作者机构:
复旦大学大数据学院,上海200433
文献出处:
引用格式:
[1]陈云璐;张楠-.大数据岭回归的最优子抽样)[J].复旦学报(自然科学版),2022(01):1-9
A类:
岭杠杆值
B类:
岭回归,回归问题,计算效率,子抽样方法,模型框架,最小二乘估计,子样本,渐近性质,均方误差,优化准则,抽样估计,L2,范数,近似方法,计算成本
AB值:
0.258704
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。