主要内容

分级资源管理案例研究示例

这个例子说明了如何使用创建信用记分卡分级浏览器应用程序。用来分级浏览器到仓中的数据,绘制分级数据信息,以及出口CreditsCorecard.对象。然后用来CreditsCorecard.对象,使用Financial Toolbox™中的函数来拟合逻辑回归模型,确定数据的得分,确定违约概率,并使用三种不同的指标验证信用记分卡模型。

步骤1。负载信用计分卡数据进入了马铃薯工作区。

用来CreditCardData.mat文件来加载数据在MATLAB®工作区(使用从2011年Refaat数据集)。

加载CreditCardDataDISP(数据(1:10,:))
的CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate状态______ _______ ___________ __________ _________ __________ _______ _______ _________ ________ ______ 1 53 62租户未知50000 55是1055.9 0.22 0 2 61 22家庭业主雇员52000 25是1161.6 0.24 0 3 47 30租户业37000 61没有877.23 0.29 0 4 50 75房主业53000 20是157.37 0.08 0 5 68 56房主业53000 14是561.84 0.11 0 6 65 13房主业48000 59是968.18 0.15 0 7 34 32房主未知32000 26是717.82 0.02 1 8 50 57其它从业人员51000 33否3041.2 0.13 0 9 50 10租户未知52000 25是115.56 0.02 1 10 49 30房主未知53000 23是718.5 0.17 1

步骤2。导入数据进入分级浏览器。

开放分级浏览器从MATLAB工具条:在应用程序标签,下面计算金融,点击应用程序图标。或者,你可以输入binningExplorer在MATLAB命令行中。有关启动的更多信息分级浏览器通过命令行,看到使用数据或现有CreditScorecard对象从MATLAB命令行开始

从这一点来分级浏览器ToolStrip,选择导入数据打开导入数据窗口。

导入数据对话框

under步骤1,选择数据

under步骤2,可选择设置变量类型对于每个预测器。默认情况下,在数据的最后一列(“状态”在此实例中)被设置为“响应”.最高计数的响应值(0.在此实例中)被设置为“创先争优”.所有其他变量都被认为是预测变量。然而,在这个例子中,因为'Custid'不是预测,设定变量类型'Custid'到目前为止不包括

注意

如果输入MATLAB表包含一列权重步骤2窗格中,用变量类型列,单击下拉以选择重量.有关使用带有a的观测权重的更多信息CreditsCorecard.对象时,看到利用观测权建立信用记分卡模型

如果数据包含缺失值,则来自步骤2窗格,套滨丢失的数据:到目前为止是的.有关使用丢失的数据的详细信息,请参阅信用记分卡建模缺失值

under步骤3,休假单调作为默认初始分级算法。

点击导入数据完成导入操作。使用选择的算法自动分级被应用到所有的预测,因为它们导入到分级浏览器

盒子被绘制并显示每个预测器。通过单击从中选择单个预测仪图概要窗格,在主窗格中显示该预测仪绘图的详细信息滨信息预测器信息窗格在应用程序的底部。

预测地块合并后显示

分级浏览器执行自动合并为每一个预测变量,使用默认的“单调”带有默认算法选项的算法。对于信用记分卡来说,证据权重(WOE)的单调的、理想的线性趋势通常是可取的,因为这可以转化为给定预测器的线性点。在每个预测器的图上可以看到灾难趋势分级浏览器

执行一些初始数据探索。咨询有关统计预测'resstatus'分类变量。

点击ResStatus情节。当滨信息窗格包含“良好”和“坏”频率和其他箱子统计(如证据)(WOE)的重量。

箱信息显示

对于数字数据,都显示相同的统计数据。点击CustIncome情节。当滨信息已更新信息CustIncome

滨信息CustIncome预测

步骤3微调在分档资源管理器使用手动合并的二进制位。

点击CustAge预测的情节。注意,箱1和2具有相似的困境,因为这样做箱5和6。

策划保管预测因子

要合并箱1和2,从主窗格中,单击按Ctrl+单击或+点击多选仓1和2与蓝色轮廓来显示用于合并。

绘制了CustAge预测与选择了两个垃圾箱

在这一点分级浏览器工具条中,边缘文本框显示所选仓到合并的边缘值。

使用边线文本框来CustAge预测合并选定格

点击合并到完成合并仓1和2。CustAge预测策略图是用于新的垃圾箱信息和细节的更新滨信息预测器信息窗格也更新。

对于情节预测CustAge与两个选定格合并

接下来,合并垃圾箱4和5,因为它们也具有类似的困境。

选择用于合并情节用于CustAge预测器与箱4和5

CustAge预测剧情与新宾信息进行更新。在细节滨信息预测器信息窗格也更新。

重复此合并操作,以获取具有类似困境的以下垃圾箱:

  • 对于CustIncome,合并箱3,4和5。

  • 对于TmWBank,合并垃圾箱2和3。

  • 对于AMBalance,合并垃圾箱2和3。

现在所有的预测的信息仓具有近于直线WOE趋势。

步骤4。导出CreditsCorecard.来自Binning Explorer的对象。

你之后完成合并作业,使用分级浏览器,点击出口然后点击出口记分卡并提供A.CreditsCorecard.对象名称。当CreditsCorecard.对象(SC.)被保存到MATLAB的工作空间。

第5步。拟合逻辑回归模型。

用来fitmodel函数拟合逻辑回归模型来WOE数据。fitmodel内部仓中的训练数据,把它转换为WOE值,响应变量映射,使得“创先争优”1,与配合线性回归模型。默认情况下,fitmodel采用逐步的过程,以确定哪些预测模型中的归属。

sc = fitmodel(sc);
1.添加询问,偏差= 1490.8954,pvalue = 1.1640961C-08 2.添加tmwbank,偏差= 1467.3249,chi2stat = 23.570535,pvalue = 1.2041739E-06 3.添加余距= 1455.858,chi2stat = 11.46846那PValue = 0.00070848829 4. Adding EmpStatus, Deviance = 1447.6148, Chi2Stat = 8.2432677, PValue = 0.0040903428 5. Adding CustAge, Deviance = 1442.06, Chi2Stat = 5.5547849, PValue = 0.018430237 6. Adding ResStatus, Deviance = 1437.9435, Chi2Stat = 4.1164321, PValue = 0.042468555 7. Adding OtherCC, Deviance = 1433.7372, Chi2Stat = 4.2063597, PValue = 0.040272676 Generalized Linear regression model: logit(status) ~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance Distribution = Binomial Estimated Coefficients: Estimate SE tStat pValue ________ _______ ______ __________ (Intercept) 0.7024 0.064 10.975 5.0407e-28 CustAge 0.61562 0.24783 2.4841 0.012988 ResStatus 1.3776 0.65266 2.1107 0.034799 EmpStatus 0.88592 0.29296 3.024 0.0024946 CustIncome 0.69836 0.21715 3.216 0.0013001 TmWBank 1.106 0.23266 4.7538 1.9958e-06 OtherCC 1.0933 0.52911 2.0662 0.038806 AMBalance 1.0437 0.32292 3.2322 0.0012285 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.42e-16

步骤6.审查和格式记分卡点。

拟合Logistic模型后,点在默认情况下未缩放,并直接从WOE值和模型系数的组合来。用来displaypoints功能总结记分卡的要点。

P1 = displaypoints(SC);DISP(P1)
预测滨点____________ __________________ _________ 'CustAge' '[-Inf,37)' -0.15314 'CustAge' '[37,40)' -0.062247 'CustAge' '[40,46)' 0.045763 'CustAge'“[46,58)' 0.22888 'CustAge' '[58,Inf]' 0.48354 'ResStatus' 'Tenant' -0.031302 'ResStatus' 'Home Owner' 0.12697 'ResStatus' 'Other' 0.37652 'EmpStatus' 'Unknown' -0.076369 'EmpStatus' 'Employed' 0.31456 'CustIncome' '[-Inf,29000)' -0.45455 'CustIncome' '[29000,33000)' -0.1037 'CustIncome' '[33000,42000)' 0.077768 'CustIncome' '[42000,47000)' 0.24406 'CustIncome' '[47000,Inf]' 0.43536 'TmWBank' '[-Inf,12)' -0.18221 'TmWBank' '[12,45)' -0.038279 'TmWBank' '[45,71)' 0.39569 'TmWBank' '[71,Inf]' 0.95074 'OtherCC' 'No' -0.193 'OtherCC' 'Yes' 0.15868 'AMBalance' '[-Inf,558.88)' 0.3552 'AMBalance' '[558.88,1597.44)' -0.026797 'AMBalance' '[1597.44,Inf]' -0.21168

使用ModifierBins.给垃圾箱更具描述性的标签。

SC = modifybins(SC,'CustAge''binlabels'......{“高达36”'37到39''40到45''46到57'“58,”});SC = modifybins(SC,'CustIncome''binlabels'......{“高达28999”'29000到32999''33000至41999''42000到46999'“47000及以上”});SC = modifybins(SC,'TmWBank''binlabels'......{“高达11”'12到44''45到70'71年及以上”});SC = modifybins(SC,'AMBalance''binlabels'......{'最多558.87''558.88至1597.43'“1597.44”,});P1 = displaypoints(SC);DISP(P1)
Predictors Bin Points ____________ ___________________ _________ 'CustAge' 'Up to 36' -0.15314 'CustAge' '37 to 39' -0.062247 'CustAge' '40 to 45' 0.045763 'CustAge' '46 to 57' 0.22888 'CustAge' '58 and Up ' 0.48354 'ResStatus' 'Tenant' -0.031302 'ResStatus' 'Home Owner' 0.12697 'ResStatus' 'Other' 0.37652 'EmpStatus' '未知' -0.076369 'EmpStatus''Employed' 0.31456 'CustIncome' 'Up to 28999' -0.45455 'CustIncome' '29000 to 32999' -0.1037 'CustIncome' '33000 to 41999' 0.077768 'CustIncome' '42000 to 46999' 0.24406 'CustIncome' '47000 and up' 0.43536 'TmWBank' 'Up to 11' -0.18221 'TmWBank' '12 to 44' -0.038279 'TmWBank' '45 to 70' 0.39569 'TmWBank' '71 and up' 0.95074 'OtherCC' 'No' -0.193 'OtherCC' 'Yes' 0.15868 'AMBalance' 'Up to 558.87' 0.3552 'AMBalance' '558.88 to 1597.43' -0.026797 'AMBalance' '1597.44 and up' -0.21168

点数缩放,也经常舍入。要舍入并缩放点,使用格式点功能。例如,可以设置对应于目标级别赔率点的目标水平,并且还设置所需的点到双的赔率(PDO)。

TargetPoints = 500;TargetOdds = 2;PDO = 50;%指向一倍赔率SC = formatpoints(SC,'positeoddsandpdo',[TargetPoints Targetodds PDO]);p2 = displaypoints(sc);DISP(P2)
Predictors Bin Points ____________ ___________________ ______ 'CustAge' 'Up to 36' 53.239 'CustAge' '37至39' 59.796 'CustAge' '40至45' 67.587 'CustAge' '46至57' 80.796 'CustAge' '58 and Up ' 99.166 'ResStatus' 'Tenant' ' 62.028 'ResStatus' 'Home Owner' ' 73.445 'ResStatus' 'Other' 91.446 'EmpStatus' 'Unknown' 58.777 'EmpStatus' ' 'Employed' 86.976' CustIncome ' ' 28999 ' 31.497 ' CustIncome”“29000年到32999年的56.805“CustIncome”“33000年到41999年的69.896“CustIncome”“42000年到46999年的81.891“CustIncome”的47000和95.69“TmWBank”“11”51.142“TmWBank”“12至44”61.524“TmWBank”' 45到70 ' 92.829 ' TmWBank ' ' 71和132.87“OtherCC”“不”50.364“OtherCC”“是的”75.732“AMBalance”'升至558.87' 89.908 'AMBalance' 558.88至1597.43' 62.353 'AMBalance' 1597.44,上涨' 49.016

步骤7.评分数据。

用来函数来计算训练数据的分数。您还可以通过可选数据输入中,例如,验证数据。为每个客户每个预测器的点被设置为一个可选的输出。

[分数,点] =得分(SC);DISP(分数(1:10))DISP(点(1:10,:))
528.2044 554.8861 505.2406 564.0717 554.8861 586.1904 441.8755 515.8125 524.4553 508.3169 CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance _______ _________ _________ __________ _______ _______ _________ 80.796 62.028 58.777 95.69 92.829 75.732 62.353 99.166 73.445 86.976 95.69 61.524 75.732 62.353 80.796 62.028 86.976 69.896 92.829 50.364 62.353 80.796 73.445 86.976 95.69 61.52475.732 89.908 99.166 73.445 86.976 95.69 61.524 75.732 62.353 99.166 73.445 86.976 95.69 92.829 75.732 62.353 53.239 73.445 58.777 56.805 61.524 75.732 62.353 80.796 91.446 86.976 95.69 61.524 50.364 49.016 80.796 62.028 58.777 95.69 61.524 75.732 89.908 80.796 73.445 58.777 95.69 61.524 75.732 62.353

步骤8.计算默认的概率。

为了计算违约概率,使用probdefault功能。

pd = probdefault (sc);

定义为“好”的概率并画出预测赔率对比的格式化分数。直观地分析目标点和目标匹配的赔率,而且点到双的赔率(PDO)的关系成立。

ProbGood = 1-PD;PredictedOdds = ProbGood./pd;图散射(比分,PredictedOdds)标题(“预测赔率与分数”)Xlabel('得分')ylabel(“预测赔率”抱紧xLimits = XLIM;yLimits = ylim;%目标点和赔率情节([TargetPoints TargetPoints],[yLimits(1)TargetOdds]'K:')情节([xLimits(1)TargetPoints],[TargetOdds TargetOdds]'K:'目标点+ PDO情节([靶点+ PDO靶点+ PDO], [yLimits (1) 2 * TargetOdds),'K:')情节([xLimits(1)TargetPoints + PDO],[2个* TargetOdds 2 * TargetOdds]'K:'目标点数减去PDO绘图([targetpoints-pdo targetpoints-pdo],[ylimits(1)targetodds / 2],'K:')情节([xLimits(1)TargetPoints-PDO],[TargetOdds / 2 TargetOdds / 2],'K:'抱紧关闭

绘制预测的赔率与分数

步骤9.使用CAP,ROC和Kolmogorov-Smirnov统计数据验证信用记分卡模型

CreditsCorecard.对象支持三种验金宝app证方法,累积准确性配置文件(帽),接收器操作特征(ROC)和Kolmogorov-Smirnov(KS)统计信息。有关CAP,ROC和KS的更多信息,请参阅viewatemodel.

[统计,T] = validatemodel(SC,'plot'{'帽''ROC''KS'});DISP(统计)DISP(T(1:15,:))
测量值______________________ _______ '准确率' 0.32225 '区下ROC曲线' 0.66113 'KS统计' 0.22324 'KS得分' 499.18比分ProbDefault TrueBads FalseBads TrueGoods FalseGoods灵敏度误报警PctObs ______ ___________ ________ _________ _________ __________ ___________ __________ __________ 369.4 0.7535 0 1 802 3970 0.0012453 0.00083333 377.86 0.73107 1 1 802 396 0.0025189 0.0012453 0.0016667 379.78 0.7258 2 1 802 395 0.0050378 0.0012453 0.0025 391.81 0.69139 3 1 802 394 0.0075567 0.0012453 0.0033333 394.77 0.68259 3 2 801 394 0.0075567 0.0024907 0.0041667 395.78 0.67954 4 2 801 393 0.010076 0.0024907 0.005 396.95 0.675985 2 801 392 0.012594 0.0024907 0.0058333 398.37 0.67167 6 2 801 391 0.015113 0.0024907 0.0066667 401.26 0.66276 7 2 801 390 0.017632 0.0024907 0.0075 403.23 0.65664 8 2 801 389 0.020151 0.0024907 0.0083333 405.09 0.65081 8 3 800 389 0.020151 0.003736 0.0091667 405.15 0.65062 11 5 798 386 0.0277080.0062267 0.013333 405.37 0.64991 11 6797 386 0.027708 0.007472 0.014167 406.18 0.64735 12 6 797 385 0.030227 0.007472 0.015 407.14 0.64433 13 6 797 384 0.032746 0.007472 0.015833

CAP曲线

ROC曲线

K-的阴谋

另请参阅

||||||||||||||||

相关例子

更多关于

外部网站