FAILED
首站-论文投稿智能助手
典型文献
基于概率矩阵分解的不完整数据集特征选择方法
文献摘要:
在机器学习理论与应用中,特征选择是降低高维数据特征维度的常用方法之一.传统的特征选择方法多数基于完整数据集,对实际应用中普遍存在缺失数据的情形研究较少.针对不完整数据中含有未被观察信息和存在异常值的特点,提出一种基于概率矩阵分解技术的鲁棒特征选择方法.使用基于分簇的概率矩阵分解模型对数据集中的缺失值进行近似估计,以有效测量相邻簇之间数据的相似性,缩小问题规模,同时降低填充误差.依据缺失数据值存在少量异常值的情形,利用基于l2,1损失函数的方法进行特征选择,在此基础上给出不完整数据集的特征选择方法流程,并对其收敛性进行理论分析.该方法利用不完整数据集中的所有信息,有效应对不完整数据集中异常值带来的影响.实验结果表明,相比传统特征选择方法,该方法在合成数据集上选择更少的无关特征,可降低异常值带来的影响,在真实数据集上获得了较高的分类准确率,能够选择出更为准确的特征.
文献关键词:
矩阵分解;缺失值填补;鲁棒特征选择;不完整数据;l2;1范数
作者姓名:
范林歌;武欣嵘;童玮;曾维军
作者机构:
中国人民解放军陆军工程大学 通信工程学院,南京 210007
文献出处:
引用格式:
[1]范林歌;武欣嵘;童玮;曾维军-.基于概率矩阵分解的不完整数据集特征选择方法)[J].计算机工程,2022(06):57-64
A类:
鲁棒特征选择
B类:
概率矩阵分解,不完整数据集,数据集特征,选择方法,机器学习理论,理论与应用,高维数据,数据特征,常用方法,缺失数据,异常值,分解技术,分簇,分解模型,l2,损失函数,函数的方法,方法流程,收敛性,法利,用不完,传统特征,合成数据集,上选,真实数据,分类准确率,缺失值填补,范数
AB值:
0.277273
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。