验证模型

验证信用记分卡模型的质量

折叠所有页面

语法

统计= validatemodel (sc)

数据,数据= validatemodel (sc)

(统计、T) = validatemodel (sc、名称、值)

(统计、T、高频)= validatemodel (sc、名称、值)

描述

例子

统计数据= validatemodel (sc）验证数据的质量creditscorecard模型。

默认情况下，用于构建creditscorecard使用对象。您还可以提供应用验证的输入数据。

例子

统计数据= validatemodel (sc，数据）验证数据的质量creditscorecard使用可选参数指定的给定数据集的模型数据．

例子

［统计数据，T) = validatemodel (sc，名称,值）验证数据的质量creditscorecard模型使用可选的名称值对参数，并返回统计数据和T输出。

例子

［统计数据，T，高频) = validatemodel (sc，名称,值）验证数据的质量creditscorecard使用可选的名称-值对参数建模，并返回图形句柄高频到CAP、ROC和KS图。

例子

全部折叠

验证信用记分卡模型

打开生活的脚本

创建一个creditscorecard对象使用CreditCardData.mat文件来加载数据(使用Refaat 2011的数据集)。

负载CreditCardDatasc=信用记分卡（数据，“IDVar”，“卡斯蒂德”）

sc = creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: " VarNames: {1x11 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 0 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x11 table]

使用默认选项执行自动分类。默认情况下,autobinning.使用单调算法。

sc = autobinning (sc);

合适的模型。

sc=fitmodel（sc）；

1.加上CustIncome，偏差=1490.8527，Chi2Stat=32.588614，PValue=1.1387992e-08 2。添加TmWBank，偏差=1467.1415，Chi2Stat=23.711203，PValue=1.1192909e-06 3。添加AMBalance，偏差=1455.5715，Chi2Stat=11.569967，PValue=0.00067025601 4。添加EmpStatus，偏差=1447.3451，Chi2Stat=8.2264038，PValue=0.0041285257 5。加上保管费，偏差=1441.994，Chi2Stat=5.3511754，PValue=0.020708306。加上ResStatus，偏差=1437.8756，Chi2Stat=4.118404，PValue=0.042419078 7。加上其他Cc，偏差=1433.707，Chi2Stat=4.1686018，PValue=0.041179769广义线性回归模型：状态~[7个预测因子中包含8项的线性公式]分布=二项式估计系数：估计统计PValue uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu0.70239 0.064001 10.975 5.0538e-28保管0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055保管收入0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06其他CC 1.0883 0.52912 2 2.0569 0.039696 AMBalance 1.040.2140.2432，1192误差自由度离散度：1 Chi^2-统计与常数模型：89.7，p值=1.4e-16

格式化未缩放的点。

sc = formatpoints (sc,“PointsOddsAndPDO”, 500, 2, 50);

分数数据。

成绩=分数(sc);

通过生成CAP、ROC和KS图来验证信用记分卡模型。

(统计、T) = validatemodel (sc,“阴谋”, {“帽子”，“中华民国”，“KS”})；

图中包含一个轴对象。带有CAP (Cumulative precision Profile)曲线标题的轴对象包含patch、line、text类型的6个对象。

图中包含一个轴对象。以Receiver Operating Characteristic (ROC)曲线为标题的轴对象包含patch、line、text三种类型的对象。

图中包含一个轴对象。标题为K-S Plot的轴对象包含6个类型为line, text的对象。这些对象代表累积不良品，累积商品。

disp(统计)

测量值  ________________________ _______ {' 精度比0.32258”}{ROC曲线下面积的}0.66129{“KS统计”}0.2246 499.62{“k值”}

disp（T（1:15，：））

PctObs ______ ___________ ________ _________ _________ __________ ___________ __________ __________ 369.54 0.75313 01 802 397 0 0.0012453 0.00083333 378.19 0.73016 1 1 802 396 0.0025189 0.0012453 0.0016667 380.28 0.72444 2 1 802 395 0.0050378 0.0012453 0.0025 391.490.69234 3 1 802 394 0.0075567 0.0012453 0.0033333 395.57 0.68017 4 1 802 393 0.010076 0.0012453 0.0041667 396.14 0.67846 801 393 0.010076 0.0024907 0.005 396.45 0.67752 5 801 392 0.012594 0.0024907 0.0058333 398.61 0.67094 801 391 0.015113 0.0024907 0.0066667 398.68 0.67072 801 390 0.017632 0.0024907 0.0075 401.33 0.66255 8 801 3890.020151 0.0024907 0.0083333 402.66 0.65842 83 800 389 0.020151 0.003736 0.0091667 404.25 0.65346 93 800 388 0.02267 0.003736 0.01 404.73 0.65193 94 799 388 0.02267 0.0049813 0.010833 405.53 0.64941 11 4 799 386 0.027708 0.0049813 0.0125 405.7 0.64887 11 5 798 386 0.027708 0.0062267 0.013333

使用重量验证信用记分卡模型

这个示例使用:

打开生活的脚本

使用CreditCardData.mat载入数据的文件(数据权重)，其中包含列(rowweights.)的权重(使用来自Refaat 2011的数据集)。

负载CreditCardData

创建一个creditscorecard对象的可选名称-值对参数'teachsvar'．

sc = creditscorecard (dataWeights,“IDVar”，“卡斯蒂德”，'teachsvar'，“RowWeights”）

sc = creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: 'RowWeights' VarNames: {1x12 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 0 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x12 table]

执行自动装箱。

sc = autobinning (sc)

sc = creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: 'RowWeights' VarNames: {1x12 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 0 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x12 table]

合适的模型。

sc=fitmodel（sc）；

1.添加询问，偏差= 764.3187，PVALUE = 6.968927E-05 2.添加TMWBANK，偏差= 751.0215，CHI2STAT = 13.29726，PVALUE = 0.0002657942 3.增加余量，偏差= 743.7581，CHI2STAT = 7.263384，pvalue =0.007037455广义线性回归模型：Logit（状态）〜1 + Custincome + TMWBank +伏重分布=二项式估计系数：估计SE TSTAT PVALUE ________ ________ ________________________________________________________________________________________________________________________________________________________________TMWBANK 1.0973 0.31294 3.5063 0.0004543余距1.0039 0.37576 2.6717 0.37576 2.6717 0.37576 2.6717 0.0075464 1200观察结果，1196误差自由度分散：1 Chi ^ 2统计与常数型号：36.4，P值= 6.22E-08

格式化未缩放的点。

sc = formatpoints (sc,“PointsOddsAndPDO”, 500, 2, 50);

分数数据。

成绩=分数(sc);

通过生成CAP、ROC和KS图来验证信用记分卡模型。当可选的名称-值对参数'teachsvar'用于指定观察(样本)权重，T表使用作为加权计数的统计信息、总和和累积总和。

(统计、T) = validatemodel (sc,“阴谋”, {“帽子”，“中华民国”，“KS”})；

图中包含一个轴对象。带有CAP (Cumulative precision Profile)曲线标题的轴对象包含patch、line、text类型的6个对象。

图中包含一个轴对象。以Receiver Operating Characteristic (ROC)曲线为标题的轴对象包含patch、line、text三种类型的对象。

图中包含一个轴对象。标题为K-S Plot的轴对象包含6个类型为line, text的对象。这些对象代表累积不良品，累积商品。

统计数据

统计数据=4×2表测量值  ________________________ _______ {' 精度比0.28972”}{ROC曲线下面积的}0.64486{“KS统计”}0.23215 505.41{“k值”}

T (1:10,:)

ans =10×9表PctObs ______ ___________ ________ _________ _________ __________ ___________ __________ _________ 401.34 0.66253 1.0788 0 411.95 201.95 0.0053135 0 0.0017542 407.59 0.64289 4.8363 1.2768 410.67 198.19 0.023821 0.0030995 0.0099405 413.79 0.62292 6.9469 4.6942 407.25196.08 0.034216 0.011395 0.018929 420.04 0.60236 18.459 9.3899 402.56 184.57 0.090918 0.022794 0.045285 437.27 0.544 18.459 10.514 401.43 184.57 0.090918 0.025523 0.047113 442.83 0.52481 18.973178.71 0.11981 0.034968 0.062978 449.73 0.50095 28.246 18.049 393.9 174.78 0.13912 0.043813 0.075279 452.44 0.49153 31.511 23.565 388.38

验证信用评分卡模型当使用`BinMissingData'`选项

打开生活的脚本

此示例描述缺少数据时的分配“BinMissingData”选项设置为真正的，并计算相应的模型验证统计量。

训练集中缺少数据的预测值有一个明确的bin最终记分卡中的相应点。这些点是从证据重量（WOE）值计算的Bin和logistic模型系数。为了记分，这些分数被分配给缺失的值和超出范围的值，最后的分数被用来计算模型验证统计验证模型．
训练集中没有缺失数据的预测器没有缺失数据bin，因此不能从训练数据中估计出WOE。默认情况下，缺失值和超出范围值的点被设置为楠，这就导致了一系列的楠运行时分数．对于没有明确的预测器bin，使用名称值参数'丢失的'在formatpoints以指示如何处理缺失的数据进行评分。最后的分数用于计算模型验证统计验证模型．

创建一个creditscorecard对象使用CreditCardData.mat文件来加载dataMissing用缺失值。

负载CreditCardData.mat头部（数据缺失，5）

ans =5×11表CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate地位  ______ _______ ___________ ___________ _________ __________ _______ _______ _________ ________ ______ 53 62 <定义>未知50000 55是的1055.9 - 0.22 0 2 61 22业主雇佣52000 25是的1161.6 - 0.24 0 3 47 30租户雇佣了37000 61877.23 0.29 0 4 NaN 75自雇业主53000 20是157.37 0.08 0 5 68 56自雇业主53000 14是561.84 0.11 0

使用creditscorecard使用名称值参数“BinMissingData”着手真正的将丢失的数字或类别数据装入单独的容器中。应用自动装箱。

sc = creditscorecard (dataMissing,“IDVar”，“卡斯蒂德”，“BinMissingData”,真正的);sc = autobinning (sc);disp (sc)

creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: " VarNames: {1x11 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 1 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x11 table]

设置最小值为零保管和CustIncome．这样，任何负年龄或收入信息都将失效或“超出范围”。对于评分和默认计算的概率，超出范围的值与缺失值给出相同的分数。

sc = modifybins (sc,“CustAge”，“MinValue”,0); sc=修改箱（sc，“CustIncome”，“MinValue”, 0);

显示bin信息的数字数据“CustAge”这包括在一个单独的标签箱中丢失的数据．

bi = bininfo (sc,“CustAge”）;disp (bi)

（UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU46）“172891.9326-0.04556 0.0004549{'[46,48'}59 25 2.36 0.15424 0.0016199{'[48,51'}99 41 2.4146 0.17713 0.0035449{”[51,58）}15762.53230.224690.0088407{'[58，Inf]}93253.720.609310.032198{'}1911.7273-0.15787 0.00063885{'Totals'}8033972.0227 NaN 0.087112

显示的分类数据的bin信息“ResStatus”这包括在一个单独的标签箱中丢失的数据．

bi = bininfo (sc,“ResStatus”）;disp (bi)

Bin Good Bad Odds WOE InfoValue ______________ _____________ _________ __________ {'Tenant'} 296 161 1.8385 -0.095463 0.0035249 {'Home Owner'} 352 171 2.0585 0.017549 0.00013382 {'Other'} 128 52 2.4615 0.19637 0.0055808 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.0092627

为了“CustAge”和“ResStatus”预测器，有缺少数据（楠沙<定义>)，分箱过程估计出的WOE值为-0.15787和0.026469分别为这些预测器中的缺失数据，如上所示。

对于EmpStatus和CustIncome因为训练数据中没有这些预测器的缺失值，所以没有明确的缺失值存放。

bi = bininfo (sc,“EmpStatus”）;disp (bi)

好运气坏运气坏信息价值(uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu

bi = bininfo (sc,“CustIncome”）;disp (bi)

本好不好悲哀InfoValue几率  _________________ ____ ___ _______ _________ __________ {'[ 0, 29000)} 53 58 0.91379 -0.79457 0.06364{[29000、33000)}74年49 1.5102 -0.29217 0.0091366{[33000、35000)的36}68 1.8889 -0.06843 0.00041042{[35000、40000)的}193 98 1.9694 -0.026696 0.00017359{[40000、42000)}68 2 -0.011271 - 1.0819 e-05 34{'[42000,47000)'} 164 66 2.4848 0.20579 0.0078175 {'[47000,Inf]'} 183 56 3.2679 0.47972 0.041657 {' total '} 803 397 2.0227 NaN 0.12285

使用fitmodel利用证据权重(WOE)数据拟合逻辑回归模型。fitmodel使用自动装箱过程中找到的箱子，在内部将所有预测变量转换为WOE值。fitmodel然后使用逐步方法(默认)拟合逻辑回归模型。对于缺少数据的预测器，有一个明确的bin，并根据数据计算出相应的WOE值。当使用fitmodel，则在进行WOE转换时，应用 bin对应的WOE值。

(sc, mdl) = fitmodel (sc);

1.添加询问，偏差= 1490.8527，pvalue = 1.1387992E-08 2.添加TMWBANK，Deviance = 1467.1415，Chi2stat = 23.711203，Pvalue = 1.1192909E-06 3.添加余距，偏差= 1455.5715，Chi2stat = 11.569967，P价值＝0.00067025601 4. Adding EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5. Adding CustAge, Deviance = 1442.8477, Chi2Stat = 4.4974731, PValue = 0.033944979 6. Adding ResStatus, Deviance = 1438.9783, Chi2Stat = 3.86941, PValue = 0.049173805 7. Adding OtherCC, Deviance = 1434.9751, Chi2Stat = 4.0031966, PValue = 0.045414057 Generalized linear regression model: status ~ [Linear formula with 8 terms in 7 predictors] Distribution = Binomial Estimated Coefficients: Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70229 0.063959 10.98 4.7498e-28 CustAge 0.57421 0.25708 2.2335 0.025513 ResStatus 1.3629 0.66952 2.0356 0.04179 EmpStatus 0.88373 0.2929 3.0172 0.002551 CustIncome 0.73535 0.2159 3.406 0.00065929 TmWBank 1.1065 0.23267 4.7556 1.9783e-06 OtherCC 1.0648 0.52826 2.0156 0.043841 AMBalance 1.0446 0.32197 3.2443 0.0011775 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 88.5, p-value = 2.55e-16

通过“点数、几率和几率加倍(PDO)”方法来衡量记分卡点数“PointsOddsAndPDO”的观点formatpoints．假设您希望得分为500分，达到2的赔率（两倍于差不多），并且每50分都是每50分的赔率增加（因此550分也有4个）。

显示显示在拟合模型中保留的预测器的缩放点的记分卡。

sc = formatpoints (sc,“PointsOddsAndPDO”, (500 2));PointsInfo = displaypoints (sc)

点信息=38×3表预测本点  _____________ ______________ ______ {' CustAge’}{[0,33)的54.062}{‘CustAge}{[33岁,37)的56.282}{‘CustAge}{[37、40)的60.012}{‘CustAge}{[40岁,46)的69.636}{‘CustAge}{[46岁,48)的77.912}{‘CustAge}{[48, 51)的78.86}{‘CustAge}{[51岁,58)的80.83}{‘CustAge}{[58岁的Inf]的}96.76{‘CustAge}{< >失踪的}64.984 {'EmpStatus'} {'EmpStatus'} {'Home Owner'} 73.248 {'ResStatus'} {'Other'} 90.828 {'ResStatus'} {''} 74.125 {'EmpStatus'} {'Unknown'} 58.807 {'EmpStatus'} {'Employed'} 86.937 {'EmpStatus'} {''}⋮

注意到这一点本为保管和ResStatus显式显示(如64.9836和74.1250分别为）。这些点是根据bin和logistic模型系数。

对于在培训集中没有缺失数据的预测器，没有明确的箱子默认情况下，这些点被设置为楠因为缺少数据，他们会导致楠运行时分数．对于没有明确的预测器bin，使用名称值参数'丢失的'在formatpoints以指示如何处理缺失的数据进行评分。

出于演示的目的，从原始数据中提取几行作为测试数据，并引入一些缺失的数据。还引入一些无效或超出范围的值。对于数字数据，低于允许的最小值(或高于允许的最大值)的值被认为是无效的，例如年龄的负值(回忆一下)“MinValue”之前已为设置为0保管和CustIncome）.对于分类数据，无效值是没有显式地包含在记分卡中的类别，例如，以前没有映射到记分卡类别的居住状态，如“House”，或没有意义的字符串，如“abc123”。

这是一个非常小的验证数据集，仅用于说明缺少和超出范围值的行的评分，以及它与模型验证的关系。

tdata = dataMissing (11:18 mdl.PredictorNames);%仅在模型中保留预测值tdata。状态= dataMissing.status (11:18);%复制验证所需的响应变量值%设置一些缺失的值tdata.CustAge（1）=NaN；tdata.ResStatus（2）=' <定义> '；tdata.EmpStatus (3) =' <定义> '；tdata.CustIncome(4) =南;%设置一些无效的值tdata.CustAge (5) = -100;tdata.ResStatus (6) =“房子”；tdata.EmpStatus (7) =“自由职业者”；tdata.CustIncome (8) = 1;disp (tdata)

（UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两业主<未定义>48000 6号111.88 0 44其他未知NaN 35号436.41 0-100其他雇佣46000 16是162.21 0 33房屋就业36000 36是845.02 0 39租户自由职业者34000 40是756.26 1 24房屋业主就业-1 19是449.61 0

对新数据进行评分，并查看如何为缺失打分保管和ResStatus，因为我们有一个带有点的显式bin．但是，对于EmpStatus和CustIncome的分数功能设置点楠．

验证结果是不可靠的，分数楠保留值(请参阅验证表)价值连城，但不清楚这些影响是什么楠的值(威士达）.这是一个很小的验证数据集，但是楠分数仍然可以影响较大数据集的验证结果。

(分数,分)=分数(sc tdata);disp(分数)

481.2231 520.8353 NaN NaN 551.7922 487.9588 NaN NaN

DISP（点）

在美国，UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUNaN 96.922 96.76 73.248 NaN 96.969 51.132 50.914 89.922 69.636 90.828 58.807 NaN 61.858 50.914 89.922 64.984 90.828 86.937 82.439 61。061 75.622 89.922 56.282 74.125 86.937 70.107 61.858 75.622 63.028 60.012 62.138 NaN 67.893 61.858 75.622 63.028 54.062 73.248 86.937 NaN 61.061 75.622 89.922

[ValStats, ValTable] = validatemodel (sc tdata);disp (ValStats)

测量值___________________________ {'准确比率'} 0.16667 {'roc curve'} 0.58333 {'ks统计'} 0.5 {'ks得分'} 481.22

disp (ValTable)

词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词词NaN 0 1 5 2 0 0.16667 0.125 NaN 0 2 4 2 0 0.33333 0.25 NaN 1 2 4 1 0.5 0.33333 0.375 NaN 1 3 3 1 0.5 0.5 0.5 481.22 0.39345 2 3 0 1 0.5 0.625 487.96 0.3714 2 4 2 0 1 0.66667 0.75 520.84 0.2725 2 5 1 0 1 0.83333 0.875 551.79 0.19605 2 6 0 0 1 1 1

使用name-value参数'丢失的'在formatpoints选择如何为没有明确的预测器分配给缺少的值箱子在本例中，使用“MinPoints”选择'丢失的'论点。最低分数EmpStatus在上面显示的记分卡中58.8072和CustIncome最低分数为29.3753．

验证结果不再受楠值，因为现在所有行都有一个分数。

sc = formatpoints (sc,'丢失的'，“MinPoints”）;(分数,分)=分数(sc tdata);disp(分数)

481.2231 520.8353 517.7532 451.3405 551.7922 487.9588 449.3577 470.2267

DISP（点）

在美国，UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU922.96.76 73.248 58.807 96.969 51.132 50.914 89.922 69.636 90.828 58.807 29.375 61.858 50.914 89.922 64.984 90.828 86.93782.439 61.061 75.622 89.922 56.282 74.125 86.937 70.107 61.858 75.622 63.028 60.012 62.138 58.807 67.893 61.858 75.622 63.028 54.062 73.248 86.937 29.375 61.061 75.622 89.922

[ValStats, ValTable] = validatemodel (sc tdata);disp (ValStats)

测量值  ________________________ _______ {' 精度比0.66667”}{ROC曲线下面积的}0.83333{“KS统计”}0.66667 481.22{“k值”}

disp (ValTable)

分数ProbDefault TrueBads FalseBads TrueGoods FalseGoods敏感性FalseAlarm PctObs  ______ ___________ ________ _________ _________ __________ ___________ __________ ______ 449.36 - 0.50223 0 1 0 6 1 0.5 0.125 451.34 0.49535 1 1 5 1 0.5 0.16667 0.25 470.23 0.43036 1 2 4 1 0.5 0.33333 0.375 481.22 0.39345 - 2 2 4 0 1 0.33333 0.5 487.96 0.3714 2 3 30 1 0.5 0.625 517.75 0.28105 2 4 2 0 1 0.66667 0.75 520.84 0.2725 2 5 1 0 1 0.83333 0.875 551.79 0.19605 2 6 0 0 1 1 1

输入参数

全部折叠

`sc`- - - - - -信用计分卡模型
`creditscorecard`对象

信用记分卡模型，指定为creditscorecard对象。要创建此对象，请使用creditscorecard．

`数据`- - - - - -验证数据
表格

（可选）验证数据，指定为MATLAB^®表，其中每个表行对应于单个观察。的数据必须包含信用记分卡模型中每个预测器的列。数据列可以是以下任意一种数据类型:

数字
逻辑
字符向量的单元格数组
字符数组
分类
字符串
字符串数组

此外，表必须包含二进制响应变量。

请注意

当观测权值使用可选定义时WeightsVar创建时的名称值对参数creditscorecard对象中存储的权值WeightsVar列在对训练数据验证模型时使用。如果使用可选参数提供了不同的验证数据集数据输入时，验证数据的观察权重必须包含在名称匹配的列中WeightsVar，否则验证数据使用单位权重。有关更多信息，请参见使用带有权重的validatmodel．

数据类型：表格

名称-值参数

指定可选的逗号分隔的字符对名称,值参数。姓名是参数名和价值为对应值。姓名必须出现在引号内。可以以任意顺序指定多个名称和值对参数名称1，值1，…，名称，值．

例子:sc = validatemodel (sc、数据“AnalysisLevel”,“十分位数”,“情节”,“帽子”)

`AnalysisLevel`- - - - - -分析级别的类型
`“分数”`（默认）|带值的字符向量`“十分位数”`，`“分数”`

分析级别的类型，指定为逗号分隔对组成“分析级别”和一个字符向量，其中一个值之一：

“分数”-返回统计信息(统计数据)在观察水平。分数从最危险到最安全进行排序，重复的部分被删除。
“十分位数”-返回统计信息(统计数据)在十分位水平。分数从最危险的到最安全的，并与相应的统计数据分成10个十分位数(10%，20%，…, 100%)。

数据类型：字符

`情节`- - - - - -类型的情节
`'没有任何'`（默认）|带值的字符向量`'没有任何'`，`“帽子”`，`“中华民国”`，`“KS”`|带有值的字符向量的单元格数组`'没有任何'`，`“帽子”`，`“中华民国”`，`“KS”`

绘图类型，指定为逗号分隔的对组成“阴谋”和一个字符向量，其中一个值之一：

'没有任何'- 没有显示绘图。
“帽子”-累积精度剖面图。绘制得分为“s”的借款人比例与得分为“s”的违约者比例(“PctObs”对“敏感”列T可选的输出参数)。有关详细信息，请参见累积精度剖面(CAP)．
“中华民国”- 接收器操作特性。绘制非违约者的分数，以得分“s”与违规者的一小部分达到得分“s”（“FalseAlarm”对“敏感”列T可选的输出参数)。有关详细信息，请参见接收机工作特性(ROC)．
“KS”——Kolmogorov-Smirnov。将每个分数“s”与得分为“s”的违约者的比例，以及得分为“s”的非违约者的比例(“分数”与兼顾“敏感”和“FalseAlarm”可选输出参数的列T)。有关详细信息，请参阅Kolmogorov-Smirnov统计(KS)．

提示

对于Kolmogorov-Smirnov统计选项，可以输入“KS”或“钴”．

数据类型：字符|细胞

输出参数

全部折叠

`统计数据`——验证措施
表格

验证度量，返回为4——- - - - - -2表格第一列,“措施”，包含以下措施的名称：

精度比(AR)
ROC曲线下的区域（AUROC）
KS统计
KS得分

第二列,“价值”，包含与这些度量值相对应的值。

`T`-验证统计数据
大堆

验证统计数据，作为N——- - - - - -9验证统计数据表，按分数排序，从最危险到最安全。当AnalysisLevel设置为“十分位数”，N等于10．否则,N等于唯一分数的总数，即没有重复的分数。

桌子T按此顺序包含以下九列:

“分数”-分数从最危险到最安全。这一行的数据对应到这一行的所有观察结果，包括这一行的分数。
“ProbDefault”-这一行观测值的违约概率。对于十分位，报告给定十分位中所有观测值的平均违约概率。
'trailbads'-“不良”累计数达到并包括相应分数。
“FalseBads”-“货物”累计数量达到并包括相应分数。
“真实商品”-超过相应分数的“货物”累计数量。
“FalseGoods”-超过相应分数的“坏”的累计次数。
“敏感”-违约者的分数（或累计“不良资产”数除以“不良资产”总数）。这是“不良”的分布，包括相应的分数。
“FalseAlarm”- 非违规者的分数（或累计的“货物数量”除以“货物”总数）。这是“商品”的分布，包括相应得分。
“PctObs”-借贷者的比例，或累计观察数除以观察总数，直到并包括相应的分数。

请注意

在创建时creditscorecard对象与creditscorecard，如果可选的名称-值对参数WeightsVar用于指定观察（样本）权重，然后T表使用作为加权计数的统计信息、总和和累积总和。

`高频`- 处理绘制措施
图处理

用于绘制度量的图形句柄，作为图形句柄或句柄数组返回。当情节设置为'没有任何'，高频为空数组。

工具书类

[1]巴塞尔银行监管委员会:内部评级系统验证研究工作文件第14号，2005年2月。

[2] Refaat, M。信用风险记分卡：使用SAS开发和实施。lulu.com, 2011。

[3] 洛弗勒，G.和波什，P.N。基于Excel和VBA的信用风险建模。威利金融,2007。

介绍了R2015a

验证模型

语法

描述

例子

验证信用记分卡模型

使用重量验证信用记分卡模型

验证信用评分卡模型当使用`BinMissingData'`选项

输入参数

`sc`- - - - - -信用计分卡模型
`creditscorecard`对象

`数据`- - - - - -验证数据
表格

名称-值参数

`AnalysisLevel`- - - - - -分析级别的类型
`“分数”`（默认）|带值的字符向量`“十分位数”`，`“分数”`

`情节`- - - - - -类型的情节
`'没有任何'`（默认）|带值的字符向量`'没有任何'`，`“帽子”`，`“中华民国”`，`“KS”`|带有值的字符向量的单元格数组`'没有任何'`，`“帽子”`，`“中华民国”`，`“KS”`

输出参数

`统计数据`——验证措施
表格

`T`-验证统计数据
大堆

`高频`- 处理绘制措施
图处理

更多关于

累积精度剖面(CAP)

接收机工作特性(ROC)

Kolmogorov-Smirnov统计(KS)

使用`验证模型`配重

工具书类

另见

话题

金融工具的文档

金宝app

用Matlab建模财务风险的实用指南

验证模型

语法

描述

例子

验证信用记分卡模型

使用重量验证信用记分卡模型

验证信用评分卡模型当使用BinMissingData'选项

输入参数

sc- - - - - -信用计分卡模型creditscorecard对象

数据- - - - - -验证数据表格

名称-值参数

AnalysisLevel- - - - - -分析级别的类型“分数”（默认）|带值的字符向量“十分位数”，“分数”

情节- - - - - -类型的情节'没有任何'（默认）|带值的字符向量'没有任何'，“帽子”，“中华民国”，“KS”|带有值的字符向量的单元格数组'没有任何'，“帽子”，“中华民国”，“KS”

输出参数

统计数据——验证措施表格

T-验证统计数据大堆

高频- 处理绘制措施图处理

更多关于

累积精度剖面(CAP)

接收机工作特性(ROC)

Kolmogorov-Smirnov统计(KS)

使用验证模型配重

工具书类

另见

话题

金融工具的文档

金宝app

用Matlab建模财务风险的实用指南

验证信用评分卡模型当使用`BinMissingData'`选项

`sc`- - - - - -信用计分卡模型
`creditscorecard`对象

`数据`- - - - - -验证数据
表格

`AnalysisLevel`- - - - - -分析级别的类型
`“分数”`（默认）|带值的字符向量`“十分位数”`，`“分数”`

`情节`- - - - - -类型的情节
`'没有任何'`（默认）|带值的字符向量`'没有任何'`，`“帽子”`，`“中华民国”`，`“KS”`|带有值的字符向量的单元格数组`'没有任何'`，`“帽子”`，`“中华民国”`，`“KS”`

`统计数据`——验证措施
表格

`T`-验证统计数据
大堆

`高频`- 处理绘制措施
图处理

使用`验证模型`配重