1、基于 AHP 法和 BP 神经网络的商业银行客户信用评估模型美国次贷危机和希腊主权债务危机使人们对次贷风险的防范意识有了更进一步的增强,特别是对金融衍生产品创新中风险度量、风险控制甚至风险管理的理论和方法进行了深层次全方位的审视和思考.毫无疑问,次贷风险的防范应该从信贷源头即商业银行客户开始.商业银行对客户的信用评估是银行贷款的核心内容,对银行客户的信用等级评估是否合理、科学、准确关系着银行贷款承担风险的大小.因此,准确评价客户信用对银行来说至关重要.商业银行客户基数大,属性多,而且不同客户有着其各自不同的特点,银行不可能依次对每一个用户进行分析来确定其信用程度,这在时间、人力以及效率等方面都
2、是不可取也是不现实的,那么银行应该按照一种特定的指标体系在拥有客户登记表的情况下对客户进行信用评估,这种特定的体系就是本文将要提出的基于 AHP 法和 BP 神经网络的商业银行客户信用评估模型.问题分析商业银行信贷最关心的是客户的信用程度和偿还能力以及在此基础上所能获得的最大利润问题,银行在评估客户信用程度时,是基于客户所提交的客户登记表来进行的,比如年龄、职业、学历、月收入、信用额度、信用历史等都是评估客户的要素.根据客户信息,银行在借贷时自然更偏重于那些职业较好、收入较高、信用历史较好的客户,但是这类客户很可能学历较低、信用额度偏大,这使得银行很难判断其真正的信用程度.因此,为了更加公正、
3、客观的评估每个客户的信用程度,银行首先应该对客户所提交的客户登记表里的信息资料进行初步评分,基于对现实的考虑,在本文中,假设银行主要对客户的 24 项基本资料进行评分,也就是说客户的信用程度就是通过这 24 项评估指标所建立起来的(如图 1 所示) 1.考察这 24 项指标,按先后顺序编号为 ,其中前 9 项决定客户的特241,x征,中间 8 项决定客户的偿还能力,最后 7 项决定客户的信用状况,由图 1 可知,银行对客户的信用程度的评估就是基于这 3 大项的加权所得.根据 BP(全称为 Back Propagation)神经网络的算法,银行可采用大量的数据进行训练学习,使各个分量的权重最后趋
4、于稳定,然后以此来计算客户的信用程度.由于在现实中很难找到大量、准确、可靠的数据来完成训练学习这个过程,因此,为了避免 BP 神经网络算法在初始化时采用随机数取值所带来的较大误差,本文首先采用层次分析法(Analytic Hierarchy Process 简称 AHP)对 24 小项以及 3 大项的权重进行计算,确定初始化数据,然后再利用 BP 神经网络算法进行训练学习.图 1 商业银行客户信用评估指标体系商业银行客户信用评估指标体系Z年龄 1x性别 2文化程度 3x职业 4婚姻状况 5健康状况 6x是否本地户口 7住宅性质 8本地居住时间 9x客户特征 1y个人财产 10家庭月收入 x活期
5、存款余额 12分期付款占收入的比重 13x工作年限 14存储帐户余额 5分期付款计划 16x其他借贷情况 7偿还能力 2y银行卡记录 18x信用历史 9代发工资情况 20信用额度 1x持卡时间 2持卡消费情况 3担保情况 24x信用状况 3y最后,根据所得结果的不同分值,我们将客户信用程度分为五类,分别用绿、蓝、黄、橙、红 5 种颜色表示客户从高到低的信用程度 1.绿色:表示该客户信用程度高,不必担忧其会发生不按期偿还贷款的情况 .蓝色:表示该客户信用程度较高,只要在还款期限之前进行适当提醒该用户就能保证按时还款.黄色:表示该客户信用程度一般,只要及时催促,就能保证其按时还款 .橙色:表示客户
6、信用程度较低,为了保证客户按时还款 ,应该加强与用户之间的联系,在借贷时也要适当进行决策.红色:表示该用户信用程度差,银行在借贷时应该考虑是否要对其进行贷款 .模型的假设分别对 AHP 法和 BP 神经网络算法中所涉及到的变量以及其他因素进行假设.1. AHP 算法所涉及到的比较矩阵是根据 Saaty 等人提出来的 1-9 尺度法进行度量的,在具体的矩阵拟定中,对人为因素所造成的误差忽略不计.2.基于现实以及计算考虑,在商业银行客户信用评估指标体系中,本文仅选取24 项,其余指标不予考虑,设 分别表示客户登记表中的 24 小项的分值,241,x在实际的银行信贷过程中,只要客户填写了客户登记表,
7、那么这 24 项的值就随之确定.3.用 表示各个小项所属的大项,分别为客户特征、偿还能力以及信用321y状况; 用 Z 表示客户的信用程度.4.在 BP 神经网络结构中, 假定输出单元的阈值为 0.5.基于商业银行客户登记表中的属性评分标准(按 1-5 之间的整数打分,分数越高,表示信用卡持有者该属性表现越好),本文将根据最后所求得的 Z 值的区间0,1将其划分为 5 个小区间 ,即0,0.2),0.2,0.4),0.4,0.6),0.6,0.8),0.8,1.0,从低到高分别代表红、橙、黄、蓝、绿五个等级,根据最后所求 Z 值落入的区间来确定该客户的信用等级.模型的建立1. 用 AHP 法获
8、得 BP 神经网络算法的初始权值AHP 法是将定性分析和定量计算相结合的一种综合计算方法,可将决策问题分为三个层次,即最上层、中间层和最下层,其分别为目标层、准则层和方案层,在具体问题中,具有广泛的实用性.在 AHP 法中,为了确定同一层次间各因素对上层影响所占的比重,下面我们将引入一种比较科学合理的比较尺度,即 尺度法193.比较尺度:在比较两个不同性质的因素 和 对于上层因素 的影响时,为iCj O了使得到的数据科学合理,本文采用 Saaty 等人提出来的 尺度法,即尺度 的19ija取值范围为 及其互反数 ,如下表 1. 1,29 1,/29尺度 ija含 义1 和 的影响相同iCj3
9、比 的影响稍强ij5 比 的影响强ij7 比 的影响明显地强iCj9 比 的影响绝对地强ij2,4,6,8 比 的影响之比在上述两个相邻等级之间ij91,2比 的影响之比与上相反(“强”改为“弱” )iCj表 1 尺度 的含义表9ija基于上述的比较尺度,以及参考了银行在实际信贷过程中考虑因素的重要性,本文拟定以下比较矩阵来表示在客户特征、偿还能力、信用状况中,商业银行信用评估各指标之间的相对重要性,具体图表如下: 1y1x23x45x67x89x1 2 511 82 31242x1 4651 135 4 1 3424 5 74x8 6 3 1 4 1 6 5 85x1 2 4 11 33 1
10、 563 5 2 1 3 1 4 5 67x21 461 1 182 3 51 51 1 29x41 7861 1表 2 客户特征中各指标的比较矩阵 xy2y10x112x1314x151617x101 33 6 2 4 1x3 1 7 1 7 1 4121 32 1 333x2 1 3 1 8 2 6146721 725x21 1 2 8 1 2 51642 3 7 1 47x1 6254 1表 3 偿还能力中各指标的比较矩阵 xy23y18x1920x2122324181 36 2 3 5 19x3 1 7 5 6 14 32061 1 4 21x2 51 1 6 1 32x3164161
11、 541521 5 1 224x1 2 3 4 1表 4 信用状况中各指标的比较矩阵 xy3相应地,本文同样得到了客户特征、偿还能力、信用状况这三个大指标之间的相对重要性比较矩阵,以此来确定商业银行客户信用评估指标中各主要元素的权重.z 1y23y11 412y3 1 234 1表 5 评估体系中 的比较矩阵321,yyz2. 模型算法设计及实现2.1 BP 神经网络结构设计BP 神经网络算法是由一个输入层、一个或多个隐含层和一个输出层组成,在本文中,与之对应的分别是 AHP 算法中的方案层、准则层和目标层 .实验证明,三层的 BP 神经网络结构应用最为广泛 .因此,本文也采用了典型的三层 B
12、P 神经网络结构 4,其中输入层节点数为 24,分别对应客户信用评估的 24 个指标,输出层节点数为 1,表示商业银行客户信用程度.经验显示,较好的隐含层节点数应介于输入节点和输出节点数量之和的 50%70%之间 6,本文通过固定样本针对不同隐含层节点数进行训练,权衡运行效率、训练次数和网络总误差,最终确定隐含层节点数为 3,如图 2 所示.图 2 三层 BP 神经网络结构图以三层为例,令 为网络输入,即为各个指标的评价值,1,nXx为隐含层输出, 为网络的实际输出,即对信用风险的评价值 .其12lYy Z中,输入层节点 到隐含层节点的权重为 ,而隐含层节点 到输出层节点的权重i ijVj为
13、,用 和 分别表示输出单元和隐含单元的阈值 ,则 :jW0j(1)11()nissijjyffx(2)1()0lssjijZffwy其中, (3)()sxfe2.2 BP 算法的实现步骤2.2.1 模型算法设计根据 BP 神经网络和 AHP 算法的特征,建立改进的 BP 神经网络算法 1,如下图 3 所示.图 3 改进的 BP 神经网络算法结构流程图2.2.2 模型算法的实现模型算法的实现步骤如下:(1) 传递函数的确定 4.传递函数是反映下层输入对上层节点刺激脉冲强度的函数,又称刺激函数,一般取为(0,1)内连续取值 Sigmoid 函数:(3)1()sxfe误差计算模型是反映神经网络期望输
14、出与计算输出之间误差大小的函数.设第 j个单元节点输出的误差为 ,则总误差为:kE(4)211()2nnljkjiiyT其中, 是第 j 个节点的期望输出值, 是第 j 个节点的实际输出值.jkTjk(2) 参数确定 1.首先依据 Saaty 等人提出的 1-9 尺度法构造比较矩阵 、xy1、 和 .通过比较矩阵最大特征根和特征向量的和法算法 3,求得xy23yz各比较矩阵的最大特征根 和特征向量 .12(,)Ti tW和法算法:a.将 A 的每一列向量归一化得 1/nijijija(5)b.对 按行求和得 ij1niijj(6)c.将 归一化 i 1/,niii(7)而 即为所求特征向量.1
15、2(,)nWd.计算 ,作为最大特征根的近似值.1(iiA而 即为所求权重向量.由于通过 AHP 法所得到的结果具有很2(,)Ti t好的一致性,因此参数的改变对运算结果不会有太大的影响.(3) 初始化.将样本计算器 p 和训练次数计数器 q 都置为 1,误差 E 置为 0.为了更加精确的得到从输入层到隐含层的权重 以及从隐含层到输出层的权重 ,本ijVjW文首先采用 AHP 法对权重 和 进行了初步确定,从而避免了常规 BP 神经网ijVjW络算法采用随机数进行初始化所带来的误差,既缩短了 BP 算法对样本训练学习的周期,又提高了计算结果的精确度.(4) 训练学习.神经网络的训练学习的过程就
16、是对样本各权重进行调整并使其趋于稳定的过程,原则是使误差不断减小.训练学习过程如下:(8)111(),23;j jdzy(9)()1,ij jjivzx(10)()(1)()/.pnpnaE其中, 为期望输出值, 为学习率,于(0,1)间取值,是为了保证 BP 算法的收敛性,1d所以,采用上述优化方法来确定. 为动量因子,是为了避免样本训练时 BP 算法陷于局部极小点,取 0 1; 为期望输出与实际输出之间的误差 .对于每一个a()pn输入的样本,计算相应的 和 ,得到权值的调整公式:1jijv11,23;jjj(11)(12),1,23.ijijijv在 和 的误差达到要求的精度时,算法停止
17、,训练学习过程结束.1zd(5)网络误差. 计算网络输出误差,设共有 个训练样本,网络对应不同的样本P有不同的误差 ,用其均方根tE(13)21/trcmtpE作为网络的总误差.其中 t 为计数器.每对样本完成一次训练学习 ,都会检查总误差是否达到精度要求或者训练次数是否达到上限值,若是,则停止,否则转到(4),直到符合要求为止.模型的求解及应用1.样本训练基于 AHP 法和 BP 神经网络算法的基本思想而建立的 BP 神经网络客户信用等级评估模型,其输入层为 24 个神经元,分别对应客户信用评估的 24 项指标,根据这 24 项指标,确定了影响客户信用评估的三大要素,即客户特征、偿还能力和信
18、用状况,最终由这三大指标确定客户的信用程度.本文随机抽取了 10 份商业银行客户登记表作为研究对象,并对其中的定性指标进行了公正合理的打分,每个指标打分的范围为1,5之间的整数.即可得到一个样本矩阵:由 AHP 法即可得到分别对应的权重向量:0.068966,0.020690,0.179310,0.289655,0.117241,0.0206897,0.027568,0.068961jv6,0.020690T0.150442,0.212389,0.061947,0.203540,0.026549,0.176991,0.115044,0.053097T2jv0.211765,0.341176,0.094118,0.105882,0.117650,0.105882,0.129412T3j0.083333,0.500000,0.416667Tj将其作为初始化数据,在 BP 神经网络结构中进行训练学习 ,最终可求得:Z=0.564539,0.563337,0.363566,0.846153,0.363095,0.736227,0.463543,0.163985,0.713585,0.413209T