首站-论文投稿智能助手
典型文献
大规模数据下子抽样模型平均估计理论
文献摘要:
随着信息时代的来临,如何从海量数据中快速、有效地挖掘有用信息是目前面临的新挑战.子抽样方法作为大规模数据分析的有效工具,已经受到国内外学者的广泛关注.不过,传统的子抽样方法通常没有考虑到模型的不确定性.当模型假设不正确时,后面的统计推断将会出现偏差,甚至导致错误的结论.为了解决该问题,文章利用频率模型平均的方法构建了子抽样模型平均估计(简称SSMA估计).理论上,文章证明了SSMA估计是全部数据下模型平均估计的一个渐近无偏且相合的估计.另外,我们基于Hansen (2007)的Mallows模型平均方法提出了SSMA估计的权重选择准则,并证明了方差已知和未知时权重估计的渐近最优性.在这些理论性质的研究中,文章同时考虑了模型和抽样设计带来的双重随机性.最后,数值分析进一步说明了所提出方法的有效性.
文献关键词:
大数据分析;子抽样方法;模型平均;Mallows准则;渐近最优性
作者姓名:
宗先鹏;王彤彤
作者机构:
北京工业大学理学部,北京100124;首都师范大学数学科学学院,北京100048
文献出处:
引用格式:
[1]宗先鹏;王彤彤-.大规模数据下子抽样模型平均估计理论)[J].系统科学与数学,2022(01):109-132
A类:
SSMA
B类:
大规模数据,下子,样模,模型平均,信息时代,海量数据,子抽样方法,经受,不正确,后面,统计推断,频率模型,无偏,相合,Hansen,Mallows,权重选择,重估,渐近最优性,理论性质,质的研究,抽样设计,随机性
AB值:
0.275023
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。