典型文献
协变量随机缺失下大规模Huber回归模型的分布式计算方法研究
文献摘要:
大数据是一种海量、高增长率、多元化的信息资产,需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力.在大数据的背景下,为了消除异常值和缺失数据的影响,本文提出一种协变量随机缺失下大规模Huber回归模型的分布式计算方法.首先对随机缺失的协变量采用逆概率加权的方法进行处理,然后将大数据进行分布式存储,构造一个交互有效的替代损失函数,将替代损失函数的优化问题与ADMM算法相结合对未知参数进行估计.模拟和实证研究表明:在有限次主从机器之间交互次数下,提出的分布式计算方法得到的估计误差递减并趋于全局最优方法得到的估计误差,且比基于平均的OneShot方法的估计误差小.
文献关键词:
大数据;Huber回归;随机缺失;分布式计算方法;ADMM算法
中图分类号:
作者姓名:
龚承刚;孙莉;刘松林;潘莹丽
作者机构:
中南财经政法大学统计与数学学院,湖北武汉430073;湖北大学数学与统计学学院,湖北武汉430062;应用数学湖北省重点实验室,湖北武汉430062
文献出处:
引用格式:
[1]龚承刚;孙莉;刘松林;潘莹丽-.协变量随机缺失下大规模Huber回归模型的分布式计算方法研究)[J].数理统计与管理,2022(06):1015-1028
A类:
交互有效的替代损失函数,OneShot
B类:
协变量,随机缺失,Huber,分布式计算方法,信息资产,处理模式,洞察,发现力,流程优化,异常值,缺失数据,逆概率加权,分布式存储,优化问题,ADMM,未知参数,限次,主从,估计误差,减并,全局最优,比基
AB值:
0.305084
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。