典型文献
基于Class Balanced Loss修正交叉熵的非均衡样本信用风险评价模型
文献摘要:
针对传统信用风险预测模型存在对非违约样本识别过度、对违约样本识别不足的问题,将平衡损失Class Balanced Loss函数引入信用风险评价,构建Class Balanced Loss修正交叉熵的非均衡样本信用风险评价模型.利用所建模型与交叉熵神经网络、支持向量机、决策树、随机森林和K最近邻5种分类模型进行对比,验证BPNN-CBCE对中国某金融机构1534笔农户贷款数据信用风险预测的有效性;在此基础上,利用UCI公开的德国信贷数据验证BPNN-CBCE模型的稳健性.研究表明:对于农户数据,BPNN-CBCE模型在AUC、违约召回率Default recall方面普遍优于BPNN-CE、SVM、DT、RF和KNN模型,其中,BPNN-CBCE的Default recall相比5种对比模型提升了41.3个百分点,AUC相比5种对比模型提升了15.6个百分点;对于德国数据集,BPNN-CBCE评级模型在AUC、违约召回率Default recall方面也均优于5种对比模型.因此,BPNN-CBCE信用评价模型对农户不均衡信贷数据中的违约样本具有较好的识别能力,可有效降低金融机构客户误判带来的损失.创新与特色:① 利用Class Balanced Loss中的平衡因子ω,增大违约样本在目标损失中的权重、降低非违约样本在目标损失中的权重,客观调节正负样本损失在目标损失中权重,弥补交叉熵函数无法调节两类样本损失权重的缺陷,克服由样本不均衡带来的评价模型对非违约样本识别过度、对违约样本识别不足.② 通过考虑数据重叠,利用随机覆盖方法,分别对贷款数据中违约、非违约样本进行不放回采样,以对全样本空间X违约、X非违约进行不重叠覆盖,计算两类贷款客户的有效样本数量.既反映由于真实数据之间的内在相似性,随着样本数量的增加,新添加样本很可能是现有样本近似重复的客观事实,也保证基于有效样本对两类样本损失进行重新加权的客观性.将图像识别领域中的Class Balanced Loss函数引入信用评价领域,既拓展了Class Balanced Loss的使用边界,也为解决不均衡样本的信用风险评价提供了新的研究思路.
文献关键词:
信用评价;Class Balanced Loss;BP神经网络;交叉熵;小额信贷
中图分类号:
作者姓名:
杨莲;石宝峰;董轶哲
作者机构:
西北农林科技大学 经济管理学院,陕西 杨凌712100;西北农林科技大学 信用大数据应用研究中心,陕西 杨凌712100;爱丁堡大学商学院,英国 爱丁堡EH89JS
文献出处:
引用格式:
[1]杨莲;石宝峰;董轶哲-.基于Class Balanced Loss修正交叉熵的非均衡样本信用风险评价模型)[J].系统管理学报,2022(02):255-269,289
A类:
CBCE,Default
B类:
Class,Balanced,Loss,非均衡样本,信用风险评价,风险评价模型,信用风险预测,风险预测模型,违约,别过,决策树,最近邻,分类模型,BPNN,金融机构,贷款,款数,UCI,国信,数据验证,户数,召回率,recall,DT,RF,KNN,对比模型,百分点,评级模型,信用评价模型,识别能力,误判,平衡因子,正负样本,补交,交叉熵函数,失权,样本不均衡,不放,放回,回采,样本空间,不重,重叠覆盖,款客,有效样本,样本数量,真实数据,新添,有样,客观事实,图像识别,决不,不均衡样本,小额信贷
AB值:
0.278956
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。