非零售客户评级打分卡项目中的核心技术方法为专家判断模型开发方法(简称方法)。该方法是以层次分析法(The analytic hierarchy process,简称AHP)等多种统计理论为基础,运用数学统计学的方法,科学合理地将反映银行风险特异性和客户行为经验以及一线专家真知灼见经验的数据进行收集、指标遴选、权重确定的专家判断打分卡的模型开发技术。
方法的具体优化步骤如下图所示:
图1 专家判断模型开发方法流程
第一步,确定专家判断打分卡优化策略。
专家判断打分卡在进行优化时,业界常用的方法包括内外部专家判断方法、专家集中讨论方法或者基于模型或模板调整的对标方法。具体采用何种方法,视银行所拥有的专家资源和可获取的外部模型资源而定。三种主要专家判断打分卡开发的特点对比如表一所示:
表1 主要专家判断打分卡开发方法比较
第二步,建立专家标准和专家库。
建立行内和行外各个行业信审专家标准,收集银行内部和同业银行的相关专家的信息,并建立银行专家库,记录专家的具体信息。
第三步,专家遴选和问卷调查。
按照不同行业的打分卡开发需求,选取合适数量的专家,进行问卷调查。问卷调查的目的主要是选取和确定打分卡的指标。
在设计问卷前,先要给出打分卡的指标池。指标池应当反映一般公司信用风险的因素。通过研究各行业风险因素的共性,借鉴和吸收国际评级机构的评级理念,将反映一般公司信用风险的因素归为非财务和财务两大类。其中,非财务类分为经营环境、市场竞争力、管理水平、道德风险和信用记录四大方面,财务类分为资本结构、规模、营运能力、盈利能力、流动性、成长性和债务覆盖等方面。每一风险因素通过相应的指标进行解释。
指标池的设计原则是指标指示风险的能力和反映风险因素的全面性。基于指标设计原则,确定出需要优化的行业信用评级应该考虑的主要指标。
在得到原始指标池后,再据此设计专家问卷,收集专家对指标池进行删减及增加的意见。
第四步,单变量分析和多变量分析。
对专家问卷调查的结果进行统计分析,确定初选入模的指标,针对这些指标设定打分的规则和分数区间后,先进行单变量分析,评估单个指标对客户排序的预测能力。再进行多变量分析,评估多个指标组合对客户排序的预测能力。由此确定打分卡最终指标。
第五步,运用统计分析方法确定入模变量和权重。
根据银行情况,最有可能采用的统计分析方法为层次分析法(The analytic hierarchy process,简称AHP)。它是一种定性和定量相结合的、系统化、层次化的分析方法。运用层次分析法有很多优点,其中最重要的一点就是简单明了。层次分析法不仅适用于存在不确定性和主观信息的情况,还允许以合乎逻辑的方式运用经验、洞察力和直觉。基于第五步所筛选出的入模变量,采用层次分析法可以计算出各指标的权重。层次分析法的具体步骤在下面进行介绍。
第六步,形成打分卡优化建议。
基于第四步和第五步的结果,可以形成最终的打分卡模型。与现行打分卡进行对比,提出打分卡优化建议。
第七步,模型校准。
、刻画校准曲线和评级映射,通过该步骤将打分卡的得分映射到符合银行实际情况的评级。
第八步,优化后打分卡验证。
对优化的打分卡进行验证,验证的方法和流程与模块一相同。模块一详见《非零售客户评级打分卡评估与验证》(戳这里)
第九步,模型调整/确型。
根据第八步验证的结果对优化后的打分卡进行调整,确定打分卡的最终形式,并投入试运行。
(1)逻辑回归(Logistic Regression)
逻辑回归模型是计算违约概率的传统工具,其基本原理是对已有客户的违约和非违约样本进行0、1分类(例如,客户发生违约记为1,客户不发生违约记为0),根据业务规则,选取一组指标作为解释变量。取得这些已有先验数据的样本后,将设为客户发生违约的概率,为客户不发生违约的概率,那么客户发生违约和不发生违约的概率之比为(称为违约事件的发生比,简称Odds),因为,所以,对这个比值取自然对数,由此建立线性回归方程为:
逻辑回归的模型构建过程如下图所示,图中横轴为自变量(或解释变量)取值,纵轴为客户违约概率,“五星”代表违约客户样本,“圆球”代表非违约客户样本,“倾斜直线”为线性回归方程,“粗体曲线”为Logistic回归方程:
图2 逻辑回归示意图
Logistic回归模型实际上是普通多元线性回归模型的推广,其误差项服从二项分布,而非正态分布,因此,在拟合时采用最大似然估计法进行参数估计。
利用先验样本得出逻辑回归函数:
然后将被评级客户的相应变量代入上述判别分析式,就可以直接求出该评级客户的违约概率为: 。
国际和国内先进银行的实践经验标明,逻辑回归分析对于估计违约概率是比较有效的。
(2)判别分析
判别分析是一种通过度量特定范畴内的因素,对事物进行预测和分类的方法,例如,判断银行客户是否会在一定时期内违约,只要能确定所有可能的影响因素,模型就可以使用这些因素在违约和非违约之间做出判别。在错判概率最小或错判损失最小的前提下,建立一个计算准则,依据该准则对给定样本的违约状况进行判别分析。
违约概率的计算属于多元判别分析,具体步骤为:
将已有客户的数据按其违约记录分为违约组和非违约组。根据业务逻辑和信贷经验,对两组样本选择相应的自变量指标形成基础数据样本。
求取一组自变量的最佳权重,使得违约组和非违约组之间的分离度达到最大。其中,分离度是组内数据点举例之和与组见数据点距离之和的函数。为了便于理解,假设以三个指标x,y,z来计算客户的违约概率,求取这三项指标的最佳权重a、b、c,将客户的数据样本表示为三维向量的空间点阵,如下图所示。求取最佳权重的几何意义是寻找一个向量,使得在沿着这个方向观察到的横截面上,违约样本和非违约样本的分离度达到最大。从统计上可以证明,不断旋转权重向量,总能找到一组权重a1、b1、c1,使违约样本和非违约样本能够最大程度地分离。由此,得到判别分析公式:。
图3 判别分析法指标和权重示意图
图4 判别分析最佳向量的横截面
将被评级客户的相应变量x,y,z代入上述判别分析式,求得其与两组样本(违约样本和非违约样本)中心点的空间距离,其中距离较小的表示客户与该组样本相似,由此将其归入此类别,即违约或非违约,并根据空间距离的远近求出被评级客户的违约概率。
(3)主成分分析
主成分分析是“空间旋转”构造原始变量的线性组合,它产生了一系列互不相关的新变量,从中选出少数主要变量,这些变量包含了尽可能多的原始变量信息,从而使得用这几个新变量代替原始变量分析和解决问题成为可能。当研究对象确定后,变量中所含信息的多少通常用该变量的样本方差来度量。在现实经济生活中,影响违约概率的因素很多,如企业的经营状况、财务状况、还款意愿、担保品价值、政府干预等,这些因素对违约的发生有着不同的影响。对违约概率的分析没有必要考虑所有的影响因素,运用主成份分析可以从变量的相互影响关系中萃取主要因素,并根据各要素所含信息的多少确定变量关系和计算方法。
统计实验标明,该方法可以有效地确定解释变量集合,特别是在无导师分析(只有可能的自变量集合,但尚缺乏违约记录)过程中,能够发挥Logistic回归和判别分析所不具备的功能。若与其他模型结合,通常会收到良好的效果。
(4)神经网络模型
神经网络模型是近年来发展起来的一种信用分析模型。它能深入挖掘预测变量之间的关系。它的基本原理是神经网络接受一组输入信息并产生反应,然后与预期反应相比较。如果错误率超过可接受水平,则需要对权重做出修改并开始学习过程。经过反复循环,错误率就可以降低到可以接受的水平。达到持续的可以接受的水平后学习过程也就接受并锁定权重。因此,这种处理过程与传统多元统计模型相似,唯一的不同支出在于权重是经过反复试错而得到的,而不是通过最优解析方式得到的。
利用神经网络模型来估计违约概率有着比较大的困难,分别是:计算量非常大,建模时不能利用大容量数据,因为当训练样本很大时,计算所需的时间很长,所需空间也变得非常大;神经网络模型得到的权重通常是局部最优解,而不是全局最优解,因此对初始值的选择要求非常高;神经网络模型的解释力比较差,;容易产生过度拟合问题,预测力比较差。因此商业银行基本上不会采用神经网络模型来估计违约概率。
银行估计各个评级客户的违约概率后,按照违约概率从小到大排列后,银行根据业务实际,按照违约概率的区间对所有的评级客户进行评级。
模型的校准包括样本校准和中心趋势校准两部分。
(1)样本校准
按照统计模型的逻辑,模型输出结果就是违约概率,但是为了更精确地对应,一般都要进行校准,而且模型一般不仅有定量模块还有定性模块,校准就更有必要。
模型的校准是将最终得分和违约概率(一年期违约概率)进行映射的过程。假设最终的分和违约概率服从对数分布,即二者的映射关系通常通过下式对直方图进行曲线拟合。
(2)中心趋势校准
由于建模样本和总体样本的平均违约率并不一致,还需要中心趋势校准。
A:中心趋势的估计通常采用历史违约数据进行估计,同时预期未来的违约概率变化;
B:中心趋势的决定是整个评级过程中最重要的参数,必须能够征得高级管理层的同意,并且和银行的现行政策保持一致。模型的校准反映银行的风险偏好,并将影响各个敞口的风险调整收益;
C:另外考虑到经济周期的波动等因素,中心趋势应该能够反映银行资产组合违约概率的长期平均。
中心趋势的基本思想可以通过下式表达:
PD(校准)=PD×(多年总体样本历史平均违约率÷建模样本历史平均违约率)
也有理论认为,从模型应用角度,模型违约概率应该是向前看的预测违约概率,则中心趋势的基本思想可以用下式表达:
PD(校准)=PD ×(预期总体样本平均违约率÷建模样本历史平均违约率)
定期持续监控方法论主要包括定期持续监控的内容、定期持续监控的流程和定期持续监控的方法三个方面。相关持续监控制度主要是依据方法论来接和行内实际情况制定政策明确持续监控做什么、怎么做、谁来做、何时做。
(1)定期持续监控的内容
定期持续监控的内容主要包括:一是评级治理工作情况;二是评级系统运作情况,包括评级流程、评级推翻情况;三是评级政策执行和调整情况;四是评级结果的准确性;五是评级使用情况;六是数据存储、管理、维护情况和数据质量;七是评级指标或风险变量的稳定性和预测性;八是评级模型的稳定性;九是评级分布和评级迁徙情况;十是评级模型使用环境的变化情况;十一是前一验证阶段发现的风险点。
(2)定期持续监控的流程
定期持续监控的流程主要包括设定监控指标体系、实施定期持续监控和形成持续监控报表或报告三方面内容。
A:设定监控指标体系
由行内专家(包括模型专家和业务专家)通过会议和讨论的方式确定一组对内部评级计量模型运行产生影响的监控指标,包括宏观经济监控指标,行业基本因素监控指标、模型整体表现监控指标、评级分布和评级迁徙监控指标、评级人工推翻监控指标等,以监控计量模型的表现是否能够适应当前的经济状况,是否仍在银行能够接受的范围内运行。
B:实施定期持续监控
对于非零售风险暴露内部评级计量模型,定期由持续监控人员分析以上模型监控指标是否发生重大变化,所发生的变化是否直接或间接影响模型的结果,影响程度等。
对于非零售风险暴露内部评级支持体系,定期由验证主体针对验证范围、内评级治理工作情况、评级系统运作情况、评级政策执行和调整情况、评级使用情况等关键控制点,制定检查清单,每季度按清单内容进行核查,确保内部评级体系支持体系正常运作。
C:形成持续监控报表或报告
综合各因素对模型结果的影响程度,判断非零售内部评级体系的有效性,是否能够有效支持银行信用风险管理的稳定运行。根据监控结果对风险因素进行上调或者下调,或者利用最新信息进行重新训练和估算。
针对非零售风险暴露内部评级体系持续监控的情况,形成完整的文档记录,包括持续监控的范围、内容、方法、步骤、结果、报告、已识别的缺陷以及整改措施和改进情况评估等。
(3)定期持续监控的方法
定期持续监控的方法主要包括过程检查、返回检验和基准测试三方面内容。
A:过程核查
过程核查包括对内部评级以及风险参数量化是否按照设计要求运作、监控和更新评估的一系列活动。
过程核查还包括确定数据的质量、评级流程的合理性等活动,并应确保查明的缺陷得到纠正。
B:返回检验
非零售风险暴露模型的返回检验是比较内部评级体系预测结果与实际结果,运用数理统计工具对模型的准确性、区分能力和稳定性进行验证。
通过统计计量技术,使用PD实际值检验其内部模型的估计结果。
C:基准测试
基准测试是对模型结果进行返回检验的补充验证方法,也是对低违约资产组合的风险参数量化进行验证的一种有效方式。详见《编外篇:债务人评级模型低违约组合的验证》(戳这里)
从验证的工作角度来看,基准测试指银行对风险参数的估计结果与通过其他估计方法得出的估计结果(基准)进行比较,来验证估计结果的准确性。
叶征,毕业于北京大学光华管理学院,师从我国著名金融学家曹凤岐教授。目前任天津星通天安科技有限公司副总裁,天津星通天安保险代理有限公司总经理,主要负责物联网保险业务以及物联网金融风险管理工作(天津星通天安是一家专注于物联网大数据金融服务的公司)。
加入天津星通天安管理层前,在德信汇智咨询公司任副总裁,主要从事针对中小银行信用风险计量与建模技术服务及经济资本管理的研究与应用工作,德信汇智公司脱胎于德勤公司风险与资本服务部。
还曾在中国人寿保险(集团)公司任职六年,主管保险集团资产负债管理、资本规划与经济资本管理等工作,任职期间曾被中国人寿外派澳大利亚悉尼工作,论文《保险公司资产负债管理模式探析》在核心期刊《保险研究》2013年第11期发表。
除此之外,还先后供职于普华永道会计师事务所和德勤华永会计师事务所,参与了多家大型银行的全面风险管理、内部评级法建设中评级模型的开发、验证和优化等工作。
如果您对我们的微店商品感兴趣,
请扫描下方二维码
点击“阅读原文”进入微店!