机器学习模型预测信用违约性能探究:监管评估新方法

需积分: 18 4 下载量 134 浏览量 更新于2024-07-09 收藏 1.76MB PDF 举报
本文主要探讨了使用机器学习(Machine Learning, ML)模型预测信用违约的性能,通过对比分析多种模型,包括 Logistic 回归、Lasso 惩罚式 Logistic 回归、分类与回归树(CART)、随机森林、XGBoost 和深度神经网络,研究它们在信用风险预测中的应用效果。研究使用了西班牙一家大型银行的匿名数据库,遵循内部基于评级(Internal Ratings Based, IRB)系统的监督验证方法,从分类和校准角度评估模型的预测能力。 文章指出,尽管 ML 模型在整体上表现优于传统的 Logistic 回归,但更复杂的算法并不一定带来更好的预测结果。通过模拟不同样本数量和特征数量的场景,作者展示了大数据环境下 ML 模型的优势,并量化了这种优势对监管资本的影响。例如,采用 XGBoost 替代 Lasso 等简单模型计算风险加权资产,可以节约 12.4% 至 17% 的监管资本需求。这表明 ML 在经济层面上可能带来显著的潜在利益,因此有必要深入研究以更好地理解和管理 ML 模型内置的风险。 此研究还强调了在实际应用中,除了关注模型的统计性能外,还需要考虑其经济影响,因为即使在统计上表现出色的模型,也可能在经济效益上逊色于相对简单的模型。此外,作者感谢参与讨论的专家和研讨会,以及论文部分内容来源于 José Manuel Carbó 的硕士论文,这表明研究受到了多方面的反馈和学术支持。 综上,这篇论文提出了一个新颖的监督评估方法,不仅关注 ML 模型的预测精度,还将其与监管要求和经济影响相结合,对于金融机构优化信用风险管理和决策具有重要指导意义。同时,这也为未来研究提供了方向,即如何更好地平衡模型复杂性和经济效益,以及深入探究 ML 模型内在的风险因素。