典型文献
融合实例频率加权正则化和神经网络的概率矩阵分解模型
文献摘要:
针对大规模稀疏数据集上基于概率矩阵分解(Probabilistic Matrix Factorization,PMF)模型的缺失数据估计方法容易出现过拟合且迭代训练时间较长的问题,本文创新性地提出一种融合实例频率加权正则化(Instance-frequency-weighted Reg?ularization,IR)和神经网络(Neural Network,NN)的概率矩阵分解(IR-NNPMF)模型.一方面,充分考虑已知数据在数据集中的不平衡分布现象,并根据潜在因子相关的实例频率对其正则化参数进行加权处理,从而提高模型的泛化能力和预测精度;另一方面,引入神经网络来缓解模型迭代训练造成的时间消耗,提高模型预测精度的同时减少模型训练时间.最后,在4个真实数据集上的实验结果证明,和带标准L2正则化和使用传统梯度下降训练算法的经典PMF模型相比,本文提出的IR-NNPMF模型能够在提高预测精度的同时大大提高模型的训练速度.
文献关键词:
概率矩阵分解;大规模稀疏数据;不均衡分布;正则化;神经网络
中图分类号:
作者姓名:
韦凯欣;宋燕
作者机构:
上海理工大学 理学院,上海200093;上海理工大学 光电信息与计算机工程学院,上海200093
文献出处:
引用格式:
[1]韦凯欣;宋燕-.融合实例频率加权正则化和神经网络的概率矩阵分解模型)[J].智能计算机与应用,2022(05):1-10
A类:
大规模稀疏数据,ularization,NNPMF
B类:
概率矩阵分解,分解模型,Probabilistic,Matrix,Factorization,缺失数据,据估计,估计方法,过拟合,迭代训练,训练时间,Instance,frequency,weighted,Reg,Neural,Network,已知数,平衡分布,潜在因子,正则化参数,泛化能力,入神,模型迭代,模型训练,真实数据,L2,梯度下降,训练算法,训练速度,不均衡分布
AB值:
0.347978
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。