基于机器学习方法的企业贷款违约风险预测

发布日期:2021年8月25日
基于机器学习方法的企业贷款违约风险预测 基于机器学习方法的企业贷款违约风险预测

本内容试读结束

下载后可阅读完整内容,立即下载

研究企业的贷款违约风险不仅对金融机构解决“惜贷”问题和防范信用风险具有重要的现实意义,而且能为企业规范自身经营和改善财务状况提出有针对性的建议及措施。本文根据某机构的企业贷款违约数据对贷款违约风险进行研究,首先对原始数据进行缺失值处理、特征选择和不平衡数据处理,然后利用逻辑回归、随机森林、XGBoost和LightGBM四种机器学习方法对数据进行建模和分析并比较模型优劣,最后利用GBDT模型计算特征重要性。结果表明:1) 三种集成模型的预测效果显著优于单一模型,2) 在集成模型中LightGBM模型表现出了最好的预测性能,3) 企业的纳税情况和曾经获得的授信情况可以作为判断该企业是否会发生贷款逾期现象的重要参考。

长期以来, 贷款难的问题一直阻碍着企业的发展。

虽然国家出台了一系列的支持政策, 但企业自身存在的经营风险以及贷款违约现象的频繁发生使得银行等金融机构越来越“惜贷”。

这种情况产生的根本原因在于金融机构缺乏具体有效的信用风险评估方法和防控措施, 特别是随着大数据时代的来临, 基于统计学方法的传统违约风险预测模型在数据处理方面的不足日益明显, 且不具备自学习能力, 已经无法适应如今的要求。

因此,有关机构能否获得更加高效又切实可行的信用风险评估模型成为决定其未来发展的关键。

2. 文献综述 随着人工智能理论的深入发展,众多学者在基于机器学习算法的信用风险评估方法上取得了丰硕的研究成果。例如,朱景文以上市公司的债券违约风险为研究对象,证明了经过遗传算法优化的BP 神经网络模型在公司债违约风险评估应用中的高准确性[1]。王晓菲等通过将AI 模型与传统信用风险度量模型相结合的方法,从多角度对房地产企业的信用违约风险进行研究[2]。李占玉将SMOTE 算法与随机森林相结合构建了互联网金融公司的财务风险评估模型,并取得了良好的预测效果[3]。潘永明等利用引入信息增益的SVM 算法构建供应链中小企业信用风险分类预测模型,结果显示该模型比单一SVM 模型精度提高8.97% [4]。郑建国等将PCA、SMOTE 与通过网格搜索法进行参数寻优的SVM 模型相结合对企业信用风险进行研究,结果表明新构建的模型具有更高的稳定性和预测能力[5]。胡贤德等针对传统BP神经网络在实际应用中学习速度慢、易陷入局部解以及运算结果误差较大等缺陷,提出一种基于改进离散型萤火虫(IDGSO)算法的BP 神经网络集成算法,并以此建立了小微企业信用风险评估模型,该模型有效提高了预测准确性[6]。

3. 基本方法 本文选择使用逻辑回归、随机森林、XGBoost (Extreme Gradient Boosting)和LightGBM (Light Gradient Boosting Machine)四种模型对企业贷款违约数据进行建模研究,并根据研究结果选出预测性能最优的模



相关标签