典型文献
考虑数据源网络结构的高维数据整合分析与子群识别研究
文献摘要:
大数据时代,收集到的数据维度越来越高,数据来源也越来越多.针对多源高维数据,本文提出了一种考虑数据源网络结构的多源高维数据整合分析方法,利用k近邻方法构建数据源间的网络结构,对于有网络连接的数据集的模型系数施加Network MCP惩罚来自动识别同质数据和异质数据,并利用MCP惩罚筛选每个数据集的重要变量,能同时进行各数据源的模型估计、变量选择以及数据源的子群识别.模拟实验表明,在不同的模拟设置下本文所提方法在变量选择、参数估计和分类预测准确率上都有良好的效果.最后,将该方法应用到房地产租赁评价数据上,利用经纬度位置信息构建数据源间的网络结构,可以很好地识别出房地产子市场,并在模型上具有更好的解释性.
文献关键词:
多源高维数据;整合分析;网络结构;子群识别
中图分类号:
作者姓名:
方匡南;张晴雯;林洪伟
作者机构:
厦门大学经济学院;香港科技大学
文献出处:
引用格式:
[1]方匡南;张晴雯;林洪伟-.考虑数据源网络结构的高维数据整合分析与子群识别研究)[J].统计研究,2022(07):125-136
A类:
子群识别,多源高维数据
B类:
数据源,数据整合分析,数据维度,数据来源,近邻,网络连接,Network,MCP,自动识别,质数,模型估计,变量选择,模拟实验,拟设,参数估计,分类预测,预测准确率,房地产,租赁,评价数据,经纬度,位置信息,信息构建,产子,解释性
AB值:
0.280766
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。