基于代价敏感SVM的个人信用评估模型

发布日期:2017年12月28日
基于代价敏感SVM的个人信用评估模型 基于代价敏感SVM的个人信用评估模型 基于代价敏感SVM的个人信用评估模型

本内容试读结束

下载后可阅读完整内容,立即下载

基于代价敏感SVM的个人信用评估模型

本文主要研究了客户借贷规模在个人信用评估中的影响,首先按照客户借贷规模对所有借贷客户进行分类,对不同类别的客户的错判所导致的损失赋予不同的权重;然后使用代价敏感支持向量机,构建了一种新的个人信贷评估模型。实证检验说明,此模型可以降低信贷公司在个人信用评估过程中的总损失,同时提高对借贷规模相对较大的客户的判别准确率。

信用风险是信贷机构在日常工作中需要规避的主要风险之一,主要是指借贷用户在借款之后未能按时还款给机构带来损失的风险。为了减小这个风险,借贷机构需要有效的把借贷用户按照是否会违约分成两部分,建立个人信用评估模型就是常用的方法之一。

个人信用评估模型建立的目标是极小化对已有的贷款客户样本错误分类个数。用这个模型判断一个新的贷款申请者是否会违约,根据判断的结果决定是否对本次贷款申请者的申请授权。国外的个人信用评估模型建立已经非常成熟,早期主要有依靠经验判断的专家打分法,1941 年杜兰特·戴维首次将数学方法运用到个人信用评估中,使用线性判别判定个人信贷风险。之后如Z-score、ZETA 等判别分析法也相继被运用到个人信用评估模型建立中。近几年随着大数据和数据挖掘技术的发展,国内外学者也会使用非参数统计和机器学习来构建个人信用评估模型。如宋云鹏等人梳理了数据挖掘的操作流程和关键点以及常见的技术问题[1],姜明辉等人对个人信用评分的主要模型及其发展进行了归纳[2]。沈翠华等人把支持向量机算法运用在个人信用评估中并和K 近邻法相比,说明了支持向量机可以得到更好的结果[3], 肖文兵等人在使用支持向量机建立个人征信模型时使用网格5-折交叉确认来寻找不同核函数的最优参数[4],陆爱国等人首次提出基于三变量的SVM 学习算法,并将其应用到个人信用评分模型中[5]。

在这个过程中,学者发现不同的错判方式给信贷机构带来不同损失,因此在模型的建立中,需要引入“代价敏感”的概念,如2015 年段薇基于“‘把会违约的客户判为不会违约的客户’这种错误判断比‘把不会违约的客户判为会违约的客户’这种错误判断带来的损失更高”这个假设,提出一种利用熵值法来建立代价敏感支持向量机的方法[6]。

传统的代价敏感信用评估模型都是只考虑客户的待划分类别(是否违约)对误判的敏感性不同。

但是在对个人信用进行评估时,信贷机构会面临一个非常重要的问题:客户借贷规模,例如一位借款100 万元的客户和一位借款1 万元的客户,其违约与否给信贷机构带来的收益或损失是有巨大差别的,因此在建立个人信用评估模型时需要考虑客户借贷规模这一因素。但如果还是仅仅按照最小化错判个数和对是否违约代价敏感来建立模型,无法满足信贷机构的上述需求。

本文主要针对不同借贷规模的客户对于公司的影响不同这一实际问题,对不同借贷规模的客户进行分类,同时考虑客户借贷规模和违约与否这两个因素对于误判的敏感性,使用代价敏感的支持向量机建立个人信用评估模型,对客户进行分类判别,以此来降低借贷公司在客户信用评估方面的总损失。

2. 支持向量机 支持向量机(Support Vector Machine, SVM)是数据挖掘领域一种常用的监督学习模型,主要用于二分类问题,其基本定义是在特征空间中使得不同类别之间间隔最大的线性分类器,由于核技巧的引入,使得它也可以成为非线性分类器。



相关标签