主要内容

formatpoints

格式计分卡点和可伸缩性

描述

例子

sc= formatpoints (sc,名称,值)修改计分卡点和扩展使用可选参数名称-值对。例如,使用可选名称-值对参数变化的比例分数或舍入点。

例子

全部折叠

这个例子展示了如何使用formatpoints通过提供点,规模水平,和PDO(指向概率的两倍)。通过使用formatpoints规模,你可以把分,分数在所需的范围内更有意义的实际目的。从技术上讲,这涉及到一个线性变换从任何范围的扩展点formatpoints函数。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。使用“IDVar”论点creditscorecard表明“CustID”包含ID信息,不应作为一个预测变量。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);

执行自动装箱本预测。

sc = autobinning (sc);

适合一个线性回归模型使用默认参数。

sc = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1441.994 Chi2Stat = 5.3511754, PValue = 0.020708306 6。添加ResStatus、偏差= 1437.8756 Chi2Stat = 4.118404, PValue = 0.042419078 7。添加OtherCC、偏差= 1433.707 Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70239 0.064001 10.975 5.0538即使CustAge EmpStatus ResStatus 0.014687 0.60833 0.24932 2.44 1.377 0.65272 2.1097 0.034888 0.88565 0.293 3.0227 0.0025055 CustIncome TmWBank 0.0013179 0.70164 0.21844 3.2121 1.1074 0.23271 4.7589 1.9464 e-06 OtherCC AMBalance 0.039696 1.0883 0.52912 2.0569 1.045 0.32214 3.2439 0.0011792 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:89.7,p = 1.4 e-16

显示任何范围点预测留存在拟合模型并显示最小和最大可能的任何范围的分数。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ _____,预测本点* * * {‘CustAge}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{‘CustAge}{的[58岁的Inf]} 0.479 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}-0.031252 {‘ResStatus}{‘业主’}0.12696 {‘ResStatus}{‘其他’}0.37641 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.076317 {‘EmpStatus}{“雇佣”}0.31449 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的-0.45716⋮}
MinScore = -1.3100
MaxScore = 3.0726

规模,提供点,概率水平,PDO(指向概率的两倍)。假设你想要一个500分的几率2(两倍是好的比坏的),双几率每50分(这550点4)的几率。

sc = formatpoints (sc,“PointsOddsAndPDO”,(500 2));[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ ______,预测本点* * * {‘CustAge}{[无穷,33)的52.821}{‘CustAge}{[33岁,37)的54.161}{‘CustAge}{[37、40)的59.934}{‘CustAge}{[40岁,46)的67.633}{‘CustAge}{[46岁,48)的79.755}{‘CustAge}{[48, 58)的80.905}{‘CustAge}{的[58岁的Inf]} 98.838 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}62.031 {‘ResStatus}{‘业主’}73.444 {‘ResStatus}{‘其他’}91.438 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}58.781 {‘EmpStatus}{“雇佣”}86.971 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的31.309⋮}
MinScore = 355.5051
MaxScore = 671.6403

这个例子展示了如何使用formatpoints通过提供最糟糕的最好的分数值。通过使用formatpoints规模,你可以把分,分数在所需的范围内更有意义的实际目的。从技术上讲,这涉及到一个线性变换任何范围的扩展点。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。使用“IDVar”论点creditscorecard表明“CustID”包含ID信息,不应作为一个预测变量。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);

执行自动装箱本预测。

sc = autobinning (sc);

适合一个线性回归模型使用默认参数。

sc = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1441.994 Chi2Stat = 5.3511754, PValue = 0.020708306 6。添加ResStatus、偏差= 1437.8756 Chi2Stat = 4.118404, PValue = 0.042419078 7。添加OtherCC、偏差= 1433.707 Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70239 0.064001 10.975 5.0538即使CustAge EmpStatus ResStatus 0.014687 0.60833 0.24932 2.44 1.377 0.65272 2.1097 0.034888 0.88565 0.293 3.0227 0.0025055 CustIncome TmWBank 0.0013179 0.70164 0.21844 3.2121 1.1074 0.23271 4.7589 1.9464 e-06 OtherCC AMBalance 0.039696 1.0883 0.52912 2.0569 1.045 0.32214 3.2439 0.0011792 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:89.7,p = 1.4 e-16

显示任何范围点预测留存在拟合模型并显示最小和最大可能的任何范围的分数。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ _____,预测本点* * * {‘CustAge}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{‘CustAge}{的[58岁的Inf]} 0.479 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}-0.031252 {‘ResStatus}{‘业主’}0.12696 {‘ResStatus}{‘其他’}0.37641 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.076317 {‘EmpStatus}{“雇佣”}0.31449 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的-0.45716⋮}
MinScore = -1.3100
MaxScore = 3.0726

通过提供规模“坏的”“最佳”分数值。以下是一种常见的分数范围范围。显示的点信息再次确认他们现在缩放,也显示了最小和最大的分数。

sc = formatpoints (sc,“WorstAndBestScores”850年[300]);[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ ______,预测本点* * * {‘CustAge}{[无穷,33)的46.396}{‘CustAge}{[33岁,37)的48.727}{‘CustAge}{[37、40)的58.772}{‘CustAge}{[40岁,46)的72.167}{‘CustAge}{[46岁,48)的93.256}{‘CustAge}{[48, 58)的95.256}{‘CustAge}{的[58岁的Inf]} 126.46 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}62.421 {‘ResStatus}{‘业主’}82.276 {‘ResStatus}{‘其他’}113.58 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}56.765 {‘EmpStatus}{“雇佣”}105.81 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的8.9706⋮}
MinScore = 300.0000
MaxScore = 850

正如所料,的值MinScoreMaxScore对应于所需的最差和最好的成绩。

这个例子展示了如何使用formatpoints通过提供转变值。通过使用formatpoints规模,你可以把分,分数在所需的范围内更有意义的实际目的。从技术上讲,这涉及到一个线性变换从任何范围的扩展点formatpoints函数。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。使用“IDVar”论点creditscorecard表明“CustID”包含ID信息,不应作为一个预测变量。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);

执行自动装箱本预测。

sc = autobinning (sc);

适合一个线性回归模型使用默认参数。

sc = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1441.994 Chi2Stat = 5.3511754, PValue = 0.020708306 6。添加ResStatus、偏差= 1437.8756 Chi2Stat = 4.118404, PValue = 0.042419078 7。添加OtherCC、偏差= 1433.707 Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70239 0.064001 10.975 5.0538即使CustAge EmpStatus ResStatus 0.014687 0.60833 0.24932 2.44 1.377 0.65272 2.1097 0.034888 0.88565 0.293 3.0227 0.0025055 CustIncome TmWBank 0.0013179 0.70164 0.21844 3.2121 1.1074 0.23271 4.7589 1.9464 e-06 OtherCC AMBalance 0.039696 1.0883 0.52912 2.0569 1.045 0.32214 3.2439 0.0011792 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:89.7,p = 1.4 e-16

显示任何范围点预测留存在拟合模型并显示最小和最大可能的任何范围的分数。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ _____,预测本点* * * {‘CustAge}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{‘CustAge}{的[58岁的Inf]} 0.479 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}-0.031252 {‘ResStatus}{‘业主’}0.12696 {‘ResStatus}{‘其他’}0.37641 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.076317 {‘EmpStatus}{“雇佣”}0.31449 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的-0.45716⋮}
MinScore = -1.3100
MaxScore = 3.0726

通过提供规模“转变”“坡”值。在这个例子中,任意选择的转变和斜率。显示的点信息再次确认他们现在缩放,也显示了最小和最大的分数。

sc = formatpoints (sc,“ShiftAndSlope”,300年[6]);[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ ______,预测本点* * * {‘CustAge}{[无穷,33)的41.904}{‘CustAge}{[33岁,37)的42.015}{‘CustAge}{[37、40)的42.495}{‘CustAge}{[40岁,46)的43.136}{‘CustAge}{[46岁,48)的44.144}{‘CustAge}{[48, 58)的44.239}{‘CustAge}{的[58岁的Inf]} 45.731 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}42.67 {‘ResStatus}{‘业主’}43.619 {‘ResStatus}{‘其他’}45.116 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}42.399 {‘EmpStatus}{“雇佣”}44.744 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的40.114⋮}
MinScore = 292.1401
MaxScore = 318.4355

这个例子展示了如何使用formatpoints分离基础点的点分配给每个预测变量。的formatpoints名称-值对的观点“BasePoints”符合这个目的。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。使用“IDVar”论点creditscorecard表明“CustID”包含ID信息,不应作为一个预测变量。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);

执行自动装箱本预测。

sc = autobinning (sc);

适合一个线性回归模型使用默认参数。

sc = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1441.994 Chi2Stat = 5.3511754, PValue = 0.020708306 6。添加ResStatus、偏差= 1437.8756 Chi2Stat = 4.118404, PValue = 0.042419078 7。添加OtherCC、偏差= 1433.707 Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70239 0.064001 10.975 5.0538即使CustAge EmpStatus ResStatus 0.014687 0.60833 0.24932 2.44 1.377 0.65272 2.1097 0.034888 0.88565 0.293 3.0227 0.0025055 CustIncome TmWBank 0.0013179 0.70164 0.21844 3.2121 1.1074 0.23271 4.7589 1.9464 e-06 OtherCC AMBalance 0.039696 1.0883 0.52912 2.0569 1.045 0.32214 3.2439 0.0011792 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:89.7,p = 1.4 e-16

显示任何范围点预测留存在拟合模型并显示最小和最大可能的任何范围的分数。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ _____,预测本点* * * {‘CustAge}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{‘CustAge}{的[58岁的Inf]} 0.479 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}-0.031252 {‘ResStatus}{‘业主’}0.12696 {‘ResStatus}{‘其他’}0.37641 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.076317 {‘EmpStatus}{“雇佣”}0.31449 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的-0.45716⋮}
MinScore = -1.3100
MaxScore = 3.0726

通过设置名称-值对的论点BasePoints为true,点信息表报告基础点分别在第一行。最小和最大可能的分数是不受此选项。

sc = formatpoints (sc,“BasePoints”,真正的);[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =38×3表预测本是_____________ _____点* * * {‘BasePoints} {‘BasePoints} 0.70239 {‘CustAge}{[无穷,33)的-0.25928}{‘CustAge}{[33岁,37)的-0.24071}{‘CustAge}{[37、40)的-0.16066}{‘CustAge}{[40岁,46)的-0.053933}{‘CustAge}{[46岁,48)的0.11411}{‘CustAge}{[48, 58)的0.13005}{‘CustAge}{的[58岁的Inf]} 0.37866 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}-0.13159 {‘ResStatus}{‘业主’}0.026616 {‘ResStatus}{‘其他’}0.27607 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.17666 {‘EmpStatus}{“雇佣”}0.21415 {‘EmpStatus}{' <失踪>}南⋮
MinScore = -1.3100
MaxScore = 3.0726

这个例子展示了如何使用formatpoints来点。四舍五入后通常是应用扩展,否则,如果一个特定的预测的点都在一个小范围内,舍入可能导致圆角点不同的垃圾箱是相同的。同时,舍入所有的点可能略有改变最小和最大总点。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。使用“IDVar”论点creditscorecard表明“CustID”包含ID信息,不应作为一个预测变量。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);

执行自动装箱本预测。

sc = autobinning (sc);

适合一个线性回归模型使用默认参数。

sc = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1441.994 Chi2Stat = 5.3511754, PValue = 0.020708306 6。添加ResStatus、偏差= 1437.8756 Chi2Stat = 4.118404, PValue = 0.042419078 7。添加OtherCC、偏差= 1433.707 Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70239 0.064001 10.975 5.0538即使CustAge EmpStatus ResStatus 0.014687 0.60833 0.24932 2.44 1.377 0.65272 2.1097 0.034888 0.88565 0.293 3.0227 0.0025055 CustIncome TmWBank 0.0013179 0.70164 0.21844 3.2121 1.1074 0.23271 4.7589 1.9464 e-06 OtherCC AMBalance 0.039696 1.0883 0.52912 2.0569 1.045 0.32214 3.2439 0.0011792 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:89.7,p = 1.4 e-16

显示任何范围点预测留存在拟合模型并显示最小和最大可能的任何范围的分数。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表___________ _____,预测本点* * * {‘CustAge}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{‘CustAge}{的[58岁的Inf]} 0.479 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}-0.031252 {‘ResStatus}{‘业主’}0.12696 {‘ResStatus}{‘其他’}0.37641 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.076317 {‘EmpStatus}{“雇佣”}0.31449 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的-0.45716⋮}
MinScore = -1.3100
MaxScore = 3.0726

规模点,并显示点的信息。默认情况下,没有舍入。

sc = formatpoints (sc,“WorstAndBestScores”850年[300]);PointsInfo = displaypoints (sc)
PointsInfo =37×3表___________ ______,预测本点* * * {‘CustAge}{[无穷,33)的46.396}{‘CustAge}{[33岁,37)的48.727}{‘CustAge}{[37、40)的58.772}{‘CustAge}{[40岁,46)的72.167}{‘CustAge}{[46岁,48)的93.256}{‘CustAge}{[48, 58)的95.256}{‘CustAge}{的[58岁的Inf]} 126.46 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}62.421 {‘ResStatus}{‘业主’}82.276 {‘ResStatus}{‘其他’}113.58 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}56.765 {‘EmpStatus}{“雇佣”}105.81 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的8.9706⋮}

使用名称-值对的论点舍入申请所有点然后再显示点信息。

sc = formatpoints (sc,“圆”,“AllPoints”);PointsInfo = displaypoints (sc)
PointsInfo =37×3表___________ ______,预测本点* * * {‘CustAge}{'[无穷,33)}46 {‘CustAge}{'[33岁,37)}49 {‘CustAge}{[37、40)的}59 {‘CustAge}{[40岁,46)}72 {‘CustAge}{[46岁,48)}93 {‘CustAge}{[48, 58)的95}{‘CustAge}{的[58岁的Inf]} 126 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}62 {‘ResStatus}{‘业主’}82 {‘ResStatus}{‘其他’}114 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}57 {‘EmpStatus}{“雇佣”}106 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的}9⋮

这个例子表明,舍入计分卡点可以修改原始风险等级信用计分卡。你可以通过使用控制舍入formatpoints可选的名称-值对的理由“四舍五入”

信用评分等级客户的风险。如果给出更高的分数更好,低风险的客户,那么更高的分数必须对应于较低的违约概率。当你使用名称-值对的理由“四舍五入”,这取决于的值“四舍五入”,舍入行为是:

  • “四舍五入”被设置为“没有”(默认选项),没有舍入应用于点或分数,排名和风险是完全符合校准模型。

  • “四舍五入”被设置为“FinalScore”,舍入只是应用到最后的分数。在这种情况下:1)客户提供不同的分数(不同的风险)可能有相同的圆形的分数。b)客户使用相同的圆形的分数可能有不同的违约概率。c)客户提供更高的圆形的分数总是比客户违约概率较低较低的分数。

  • “四舍五入”被设置为“AllPoints”,舍入是适用于所有分计分卡(所有箱子,所有预测)。在这种情况下:1)客户提供不同的分数(不同的风险)可能有相同的圆形的分数,或者他们的排名甚至可能扭转(客户降低原始分数可能有更高的分数)。b)客户使用相同的圆形的分数可能有不同的违约概率。c)客户提供更高的分数可能在某些情况下更高的比客户违约概率较低的分数。

创建一个creditscorecard

为了演示舍入行为,首先创建一个creditscorecard对象。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”,“ResponseVar”,“状态”);sc = autobinning (sc);sc = modifybins (sc,“CustIncome”,“割点”,20000:5000:60000);sc = fitmodel (sc);
1。添加CustIncome、偏差= 1487.9719 Chi2Stat = 35.469392, PValue = 2.5909009 e-09 2。添加TmWBank、偏差= 1465.7998 Chi2Stat = 22.172089, PValue = 2.4927133 e-06 3。添加AMBalance、偏差= 1455.206 Chi2Stat = 10.593833, PValue = 0.0011346548 - 4。添加EmpStatus、偏差= 1446.3918 Chi2Stat = 8.8142314, PValue = 0.0029889009 5。添加CustAge、偏差= 1440.6825 Chi2Stat = 5.709236, PValue = 0.016875883 6。添加ResStatus、偏差= 1436.1363 Chi2Stat = 4.5462043, PValue = 0.032991806 7。添加OtherCC、偏差= 1431.9546 Chi2Stat = 4.1817827, PValue = 0.040860699广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70247 0.064046 10.968 5.4345即使CustAge EmpStatus ResStatus 0.013058 0.60579 0.24405 2.4822 1.4463 0.65427 2.2105 0.02707 0.90501 0.29262 3.0928 0.0019828 CustIncome TmWBank 0.00055815 0.70869 0.20535 3.4512 1.0839 0.23244 4.6631 3.1145 e-06 OtherCC AMBalance 0.039377 1.0906 0.52936 2.0602 1.0148 0.32273 3.1445 0.0016636 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:91.5,p = 6.12 e-17

应用“四舍五入”选项

应用三种“四舍五入”选项的creditscorecard对象。

sc = formatpoints (sc,“PointsOddsAndPDO”,(500 2));%不舍入里= displaypoints (sc);(S1, P1) =分数(sc);defProb1 = probdefault (sc);sc = formatpoints (sc,“圆”,“AllPoints”);% AllPoints舍入points2 = displaypoints (sc);(S2, P2) =分数(sc);defProb2 = probdefault (sc);sc = formatpoints (sc,“圆”,“FinalScore”);% FinalScore舍入points3 = displaypoints (sc);(S3, P3) =分数(sc);defProb3 = probdefault (sc);

比较“四舍五入”选项

可视化违约概率和分数。

图保存散射(S1, defProb1,“g *”)散射(S2, defProb2“罗”)散射(S3, defProb3“b +”)传说(“不舍入”,“AllPoints”,“FinalScore”轴([388 394 0.695 0.705])包含(“信用评分”)ylabel (违约概率的)标题(违约概率和信用评分网格)

图包含一个坐标轴对象。坐标轴对象标题违约概率和信用评分,包含信用评分,ylabel违约概率包含3散射类型的对象。这些对象代表没有舍入,AllPoints FinalScore。

检查分,总分“四舍五入”选项,表的格式。

印第安纳州= (208 363 694 886);ProbDefault = defProb1(印第安纳州)
ProbDefault =4×10.6997 0.6989 0.6982 0.6972
% ScoreNoRounding = S1(印第安纳州):PointsNoRounding = P1(印第安纳州);PointsNoRounding。总= S1(印第安纳州)
PointsNoRounding =4×8表CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ____ ____总替_____ _____ _____ 52.9 61.555 58.503 24.647 51.551 50.416 89.4 388.97 67.65 61.555 58.503 24.647 51.551 75.723 49.64 389.27 54.234 61.555 58.503 24.647 51.551 75.723 63.271 389.48 52.9 92.441 58.503 24.647 61.277 50.416 49.64 389.82
% ScoreAllPoints = S2(印第安纳州):PointsAllPoints = P2(印第安纳州);PointsAllPoints。总= S2(印第安纳州)
PointsAllPoints =4×8表CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ____ ____总替_____ _____ _____ 53 62 59 25 52 50 89 390 68 62 59 25 52 76 50 392 54 62 59 25 52 76 63 391 53 92 59 25 61 50 50 390
% ScoreFinalScore = S3(印第安纳州):PointsFinalScore = P3(印第安纳州);PointsFinalScore。总= S3(印第安纳州)
PointsFinalScore =4×8表CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ____ ____总替_____ _____ _____ 389 52.9 61.555 58.503 24.647 51.551 50.416 89.4 67.65 61.555 58.503 24.647 51.551 75.723 49.64 389 54.234 389 61.555 58.503 24.647 51.551 75.723 63.271 52.9 92.441 58.503 24.647 61.277 50.416 49.64 390

最初的creditscorecard模型中,没有舍入,校准数据和逻辑回归。排名和概率统计的基础。

然而,舍入有效的修改creditscorecard模型。只有最后的分数是圆形的,这导致一些“关系”在圆形的分数,但至少风险排名(因为如果分数是不变的s1< =s2,然后轮(s1)< =圆(s2))。

然而,当你周围所有点,分数可能获得加分的机会。例如,在表中第二行(行363原始数据),几乎所有的预测都是围捕的点0.5。原来的分数是389.27。舍入的最后得分389年。然而,舍入所有的点392年,这是三分高于舍入最后的得分。

这个例子展示了如何使用formatpoints得分缺失或超出范围的数据。当数据是得分,一些观察可以是失踪(,或未定义的)或飞出他的射程。你需要决定是否点分配给这些案件。使用名称-值对的论点失踪这样做。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用数据集从Refaat 2011)。使用“IDVar”论点creditscorecard表明“CustID”包含ID信息,不应作为一个预测变量。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);

执行自动装箱本预测。

sc = autobinning (sc);

表明允许的最小值“CustAge”是零。这使得任何消极的年龄无效或超出范围的值。

sc = modifybins (sc,“CustAge”,“MinValue”,0);

适合一个线性回归模型使用默认参数。

sc = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1441.994 Chi2Stat = 5.3511754, PValue = 0.020708306 6。添加ResStatus、偏差= 1437.8756 Chi2Stat = 4.118404, PValue = 0.042419078 7。添加OtherCC、偏差= 1433.707 Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70239 0.064001 10.975 5.0538即使CustAge EmpStatus ResStatus 0.014687 0.60833 0.24932 2.44 1.377 0.65272 2.1097 0.034888 0.88565 0.293 3.0227 0.0025055 CustIncome TmWBank 0.0013179 0.70164 0.21844 3.2121 1.1074 0.23271 4.7589 1.9464 e-06 OtherCC AMBalance 0.039696 1.0883 0.52912 2.0569 1.045 0.32214 3.2439 0.0011792 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:89.7,p = 1.4 e-16

假设有缺失或范围的观测数据中,你想要的分数。注意,默认情况下,分,分数分配给缺失值

%与失踪,建立一个数据集的范围数据出于演示目的:newdata =数据(1:5);newdata.CustAge(1) =南;%失踪newdata.CustAge (2) = -100;%无效newdata.ResStatus (3) =“<定义>”;%失踪newdata.ResStatus (4) =“房子”;%无效disp (newdata)
CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate ____ ____地位………………_____ _____ _____ ________ ________ 1南62租户未知50000 55是的1055.9 - 0.22 0 2 -100 22家老板雇用了52000名25是的1161.6 - 0.24 0 3 47 30 <定义>雇佣了37000 61 877.23 0.29 0 4 50 75房子雇用了53000名20是的157.37 - 0.08 0 5 68 56家老板雇用了53000名14是的561.84 - 0.11 0
(分数,分)=分数(sc newdata);disp(分数)
南南南南1.4535
disp(分)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance替_____ _____ ________ _____南南0.12696 0.31449 0.43693 -0.076317 0.43693 0.39607 0.15842 -0.017472 -0.031252 -0.033752 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.15842 -0.017472 0.21445南南0.23039 0.31449 0.43693 -0.044811 0.15842 0.35551 0.479 0.12696 0.31449 0.43693 -0.044811 0.15842 -0.017472

使用名称-值对的论点失踪来代替点对应于一个零证据的效力(悲哀)。

sc = formatpoints (sc,“失踪”,“ZeroWOE”);(分数,分)=分数(sc newdata);disp(分数)
0.9667 1.0859 0.8978 1.5513 1.4535
disp(分)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance替_____ _____ ________ _____ 0.10034 -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 0.10034 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445 0.10034 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 0.10034 0.31449 0.43693 -0.044811 0.15842 0.35551 0.479 0.12696 0.31449 0.43693 -0.044811 0.15842 -0.017472

另外,使用名称-值对的论点失踪来代替缺失值的最低分的预测有缺失值。

sc = formatpoints (sc,“失踪”,“MinPoints”);(分数,分)=分数(sc newdata);disp(分数)
0.7074 0.8266 0.7662 1.4197 1.4535
disp(分)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ________ ________替__________ ____ ____ -0.15894 -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 -0.15894 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445 -0.031252 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 -0.031252 0.31449 0.43693 -0.044811 0.15842 0.35551 0.479 0.12696 0.31449 0.43693 -0.044811 0.15842 -0.017472

作为第三选择,使用名称-值对的论点失踪代替缺失值最大点的预测有缺失值。

sc = formatpoints (sc,“失踪”,“MaxPoints”);(分数,分)=分数(sc newdata);disp(分数)
1.3454 1.4646 1.1739 1.8273 1.4535
disp(分)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance替_____ _____ ________ _____ 0.479 -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445 0.37641 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 0.37641 0.31449 0.43693 -0.044811 0.15842 0.35551 0.479 0.12696 0.31449 0.43693 -0.044811 0.15842 -0.017472

验证分配给丢失的数据的最小值和最大值点对应的最小值和最大值点对应的预测因子。的点“CustAge”发表在前七排的点信息表。为“ResStatus”行8到10点。

PointsInfo = displaypoints (sc);:PointsInfo (1:7)
ans =7×3表预测本点___________ _______ _____ {‘CustAge}{[0, 33)的-0.15894}{“CustAge”}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{‘CustAge}{的[58岁的Inf]} 0.479
min (PointsInfo.Points (1:7))
ans = -0.1589
max (PointsInfo.Points (1:7))
ans = 0.4790
PointsInfo (8,:)
ans =3×3表预测本点_____ _________________ * * * {‘CustAge}{' <失踪>}0.479 {‘ResStatus}{“租户”}-0.031252 {‘ResStatus}{‘业主’}0.12696
min (PointsInfo.Points (8))
ans = -0.0313
max (PointsInfo.Points (8))
ans = 0.4790

这个例子描述了作业时丢失的数据点“BinMissingData”选项设置为真正的

  • 预测有缺失数据训练集的一个显式的本<失踪>在最后的计分卡对应点。计算这些点的证据的效力(悲哀)值<失踪>本和物流模型系数。为了得分,这些点被分配到缺失值,超出范围值。

  • 训练集的预测没有缺失的数据没有<失踪>本,因此可以从训练数据估计没有悲哀。默认情况下,将点失踪,超出范围值,这导致的运行时分数。没有明确的预测<失踪>本,使用名称-值参数“失踪”formatpoints指出应该如何治疗得分缺失数据的目的。

创建一个creditscorecard对象使用CreditCardData.mat文件加载dataMissing用缺失值。

负载CreditCardData.mat头(dataMissing, 5)
CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate ____ ____地位………………_____ _____ _____ ________ ________ 53 62 <定义>未知50000 55是的1055.9 - 0.22 0 2 61 22业主雇佣52000 25是的1161.6 - 0.24 0 3 47 30租户使用37000 61没有877.23 - 0.29 0 4南75业主雇佣了53000 20是的157.37 - 0.08 0 5 68 56家老板雇用了53000名14是的561.84 - 0.11 0
流(“行数:% d \ n”、高度(dataMissing))
的行数:1200
流(“CustAge缺失值的数量:% d \ n '总和(ismissing (dataMissing.CustAge)))
CustAge缺失值的数量:30
流(“ResStatus缺失值的数量:% d \ n '总和(ismissing (dataMissing.ResStatus)))
ResStatus缺失值的数量:40

使用creditscorecard名称-值的参数“BinMissingData”设置为真正的本失踪的数字或分类数据在一个单独的垃圾箱。应用自动装箱。

sc = creditscorecard (dataMissing,“IDVar”,“CustID”,“BinMissingData”,真正的);sc = autobinning (sc);disp (sc)
creditscorecard属性:GoodLabel: 0 ResponseVar:“地位”WeightsVar:“VarNames: {CustID的‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance UtilRate的“地位”}NumericPredictors: {‘CustAge’‘TmAtAddress’‘CustIncome’‘TmWBank’‘AMBalance’‘UtilRate} CategoricalPredictors: {“ResStatus”“EmpStatus”“OtherCC”} BinMissingData: 1 IDVar:“CustID”PredictorVars: {‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance’‘UtilRate}数据:[1200 x11表)

设置一个最小值为零CustAgeCustIncome。,任何负面的年龄或收入信息无效或超出范围”。为了得分,超出范围的值给出相同的点作为缺失值。

sc = modifybins (sc,“CustAge”,“MinValue”,0);sc = modifybins (sc,“CustIncome”,“MinValue”,0);

数字数据的显示和绘制本信息“CustAge”包括缺失的数据在一个单独的本标签<失踪>

(bi, cp) = bininfo (sc,“CustAge”);disp (bi)
本好与坏的几率,悲哀InfoValue _________________出生______月______ __________{[0,33)}69年52 1.3269 -0.42156 0.018993{[33岁,37)}63年45 1.4 -0.36795 0.012839{[37、40)}72年47 1.5319 -0.2779 0.0079824{'[40岁,46)}172 89 1.9326 -0.04556 0.0004549{'[46岁,48)}59 25 2.36 0.15424 0.0016199{[48,51)}99年41 2.4146 0.17713 0.0035449{'[51岁,58)}157 62 2.5323 0.22469 0.0088407{的[58岁的Inf]} 93年25 3.72 0.60931 0.032198{' <失踪>}19 11 1.7273 -0.15787 0.00063885{“总数”}803 397 0.087112 2.0227南
plotbins (sc,“CustAge”)

图包含一个坐标轴对象。坐标轴对象标题CustAge ylabel悲哀包含3对象类型的酒吧,线。这些对象是好的,坏的。

本信息为分类数据显示和阴谋“ResStatus”包括缺失的数据在一个单独的本标签<失踪>

(bi, cg) = bininfo (sc,“ResStatus”);disp (bi)
本好与坏的几率,悲哀出生______ _____ __________ InfoValue * * *{“租户”}296 161 1.8385 -0.095463 0.0035249{‘业主’}352 171 2.0585 0.017549 0.00013382{‘其他’}128年52 2.4615 0.19637 0.0055808{' <失踪>}27 13 2.0769 0.026469 2.3248 e-05{“总数”}803 397 0.0092627 2.0227南
plotbins (sc,“ResStatus”)

图包含一个坐标轴对象。坐标轴对象标题ResStatus ylabel悲哀包含3对象类型的酒吧,线。这些对象是好的,坏的。

“CustAge”“ResStatus”预测,有缺失的数据(年代和<定义>)在训练数据和装箱过程估计一个悲哀的价值-0.157870.026469分别对缺失的数据在这些预测,如上所示。

EmpStatusCustIncome没有明确本缺失值,因为这些预测的训练数据没有缺失值。

bi = bininfo (sc,“EmpStatus”);disp (bi)
本好与坏的几率,悲哀InfoValue _______出生______月______ _____{‘未知’}396 239 1.6569 -0.19947 0.021715{“雇佣”}407 158 2.5759 0.2418 0.026323{“总数”}803 397 0.048038 2.0227南
bi = bininfo (sc,“CustIncome”);disp (bi)
本好与坏的几率,悲哀InfoValue _________________出生_____ _____{[0,29000)的}53 58 0.91379 -0.79457 0.06364{[29000、33000)}74年49 1.5102 -0.29217 0.0091366{[33000、35000)的36}68 1.8889 -0.06843 0.00041042{[35000、40000)的}193 98 1.9694 -0.026696 0.00017359{[40000、42000)的}68 34 2 -0.011271 - 1.0819 e-05{[42000、47000)的}164 66 2.4848 0.20579 0.0078175{”(47000年,正)}183年56 3.2679 0.47972 0.041657{“总数”}803 397 0.12285 2.0227南

使用fitmodel适合使用逻辑回归模型的重量(悲哀)数据证据。fitmodel内部所有的预测变量转换成有祸了值,使用自动装箱的箱子里发现的过程。fitmodel然后适合使用逐步逻辑回归模型方法(默认情况下)。对于有缺失数据的预测,有一个显式的<失踪>本,对应的悲哀值计算的数据。当使用fitmodel,对应的值有祸了<失踪>本应用在执行悲哀的转换。

(sc, mdl) = fitmodel (sc);
1。添加CustIncome、偏差= 1490.8527 Chi2Stat = 32.588614, PValue = 1.1387992 e-08 2。添加TmWBank、偏差= 1467.1415 Chi2Stat = 23.711203, PValue = 1.1192909 e-06 3。添加AMBalance、偏差= 1455.5715 Chi2Stat = 11.569967, PValue = 0.00067025601 - 4。添加EmpStatus、偏差= 1447.3451 Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge、偏差= 1442.8477 Chi2Stat = 4.4974731, PValue = 0.033944979 6。添加ResStatus、偏差= 1438.9783 Chi2Stat = 3.86941, PValue = 0.049173805 7。添加OtherCC、偏差= 1434.9751 Chi2Stat = 4.0031966, PValue = 0.045414057广义线性回归模型:分对数(状态)~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance =二项分布估计系数:估计SE tStat PValue说______ __________(拦截)0.70229 0.063959 10.98 4.7498即使CustAge EmpStatus ResStatus 0.025513 0.57421 0.25708 2.2335 1.3629 0.66952 2.0356 0.04179 0.88373 0.2929 3.0172 0.002551 CustIncome TmWBank 0.00065929 0.73535 0.2159 3.406 1.1065 0.23267 4.7556 1.9783 e-06 OtherCC AMBalance 0.043841 1.0648 0.52826 2.0156 1.0446 0.32197 3.2443 0.0011775 1200观察,1192错误自由度色散:1 x ^ 2-statistic与常数模型:88.5,p = 2.55 e-16

量表的计分卡点”点,几率,并指出双概率(PDO)”使用方法“PointsOddsAndPDO”的观点formatpoints。假设你想要一个500分的几率2(两倍是好的比坏的),双几率每50分(这550点4)的几率。

显示预测的计分卡显示缩放点保留在拟合模型。

sc = formatpoints (sc,“PointsOddsAndPDO”,(500 2));PointsInfo = displaypoints (sc)
PointsInfo =38×3表预测本点______ _________________ * * * {‘CustAge}{54.062的[0,33)}{‘CustAge}{56.282“[33岁,37)”}{‘CustAge}{[37、40)的60.012}{‘CustAge}{69.636“[40岁,46)”}{‘CustAge}{[46岁,48)的77.912}{‘CustAge}{[48, 51)的}78.86 {‘CustAge}{[51岁,58)的80.83}{‘CustAge}{的[58岁的Inf]} 96.76 {‘CustAge}{' <失踪>}64.984 {‘ResStatus}{“租户”}62.138 {‘ResStatus}{‘业主’}73.248 {‘ResStatus}{‘其他’}90.828 {‘ResStatus}{' <失踪>}74.125 {‘EmpStatus}{‘未知’}58.807 {‘EmpStatus}{“雇佣”}86.937 {‘EmpStatus}{' <失踪>}南⋮

注意点<失踪>本为CustAgeResStatus明确显示(如64.983674.1250分别)。这些点从悲哀值计算<失踪>本和物流模型系数。

对预测没有缺失数据训练集,没有明确<失踪>垃圾箱。默认情况下,设置为点缺失的数据和他们导致的运行时分数。没有明确的预测<失踪>本,使用名称-值参数“失踪”formatpoints指出应该如何治疗得分缺失数据的目的。

出于演示的目的,用几行从原始数据作为测试数据,并介绍一些缺失的数据。也介绍一些无效,或超出范围的值。对于数值型数据,值低于最低(或以上最大)允许被认为是无效的,如一个负值的年龄(召回“MinValue”之前设置为0CustAgeCustIncome)。分类数据,无效值类别没有明确列入计分卡,例如,住宅状态未映射到计分卡的类别,如“房子”,或“abc123”等无意义的字符串。

tdata = dataMissing (11:18 mdl.PredictorNames);%只保留预测模型中保留%设置一些缺失值tdata.CustAge(1) =南;tdata.ResStatus (2) =“<定义>”;tdata.EmpStatus (3) =“<定义>”;tdata.CustIncome(4) =南;%设置一些无效值tdata.CustAge (5) = -100;tdata.ResStatus (6) =“房子”;tdata.EmpStatus (7) =“自由职业者”;tdata.CustIncome (8) = 1;disp (tdata)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ___________……_____ ____ ____ ____南租户未知34000 44是的119.8 48 <定义>未知44000 14是的403.62 65房主<定义> 48000年6没有其它未知南35 111.88 44 436.41 -100其他雇用了46000名16是的162.21 33家雇佣了36000 36是的845.02 39租户自由职业者34000 40是的756.26 24业主雇佣1 19是的449.61

新的数据,看看分被分配为失踪CustAgeResStatus,因为我们有一个明确的本点<失踪>。然而,对于EmpStatusCustIncome分数函数设置点

(分数,分)=分数(sc tdata);disp(分数)
551.7922 - 487.9588 481.2231 - 520.8353南南南南
disp(分)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ____ ____替_____ _____ 64.984 62.138 58.807 67.893 61.858 75.622 89.922 78.86 74.125 58.807 82.439 - 61.061 75.622 - 89.922 96.969 - 51.132 96.76 - 73.248南南61.858 50.914 89.922 50.914 89.922 69.636 90.828 58.807 64.984 90.828 86.937 82.439 61.061 75.622 89.922 56.282 74.125 86.937 70.107 - 61.858 75.622 - 63.028 67.893 - 61.858 60.012 - 62.138南南61.061 75.622 89.922 75.622 63.028 54.062 73.248 86.937

使用名称-值参数“失踪”formatpoints选择如何分配点缺失值没有一个明确的预测<失踪>垃圾箱。在这个例子中,使用“MinPoints”选择“失踪”论点。最低分EmpStatus在上面显示的记分卡58.8072,对于CustIncome最小点29.3753

sc = formatpoints (sc,“失踪”,“MinPoints”);(分数,分)=分数(sc tdata);disp(分数)
481.2231 520.8353 517.7532 451.3405 551.7922 487.9588 449.3577 470.2267
disp(分)
CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ____ ____替_____ _____ 64.984 62.138 58.807 67.893 61.858 75.622 89.922 78.86 74.125 58.807 82.439 61.061 75.622 89.922 96.76 73.248 58.807 96.969 51.132 50.914 89.922 69.636 90.828 58.807 29.375 61.858 50.914 89.922 64.984 90.828 86.937 82.439 61.061 75.622 89.922 56.282 74.125 86.937 70.107 61.858 75.622 63.028 60.012 62.138 58.807 67.893 61.858 75.622 63.028 54.062 73.248 86.937 29.375 61.061 75.622 89.922

输入参数

全部折叠

信用计分卡模型,指定为一个creditscorecard对象。使用creditscorecard创建一个creditscorecard对象。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:sc = formatpoints (sc, BasePoints,真的,‘圆’,‘AllPoints’,‘WorstAndBestScores’, (100、700))

请注意

ShiftAndSlope,PointsOddsAndPDO,WorstAndBestScores扩展方法,你可以只使用一个名称-值对参数。其他三个名称-值对参数(BasePoints,失踪,)不扩展方法,可以一起使用或与任何三个扩展方法之一。

指标分离基础点,指定为逗号分隔组成的“BasePoints”和一个逻辑标量。如果真正的点,记分卡明确分离基地。如果底点分布在所有的变量creditscorecard对象。

数据类型:字符

指标点分配给失踪或超出范围信息得分时,指定为逗号分隔组成的“失踪”和一个字符值向量NoScore,ZeroWOE,MinPoints,或MaxPoints,地点:

  • NoScore——失踪,超出范围的数据没有得到分配点和点设置。同时,总分将

  • ZeroWOE——失踪或超出范围的数据分配一个零证据的效力(悲哀)值。

  • MinPoints——失踪或超出范围的数据预测的最低分。这惩罚评分是否更好更高的分数。

  • MaxPoints——失踪或超出范围的数据获得最大可能的点预测。这惩罚更好如果较低分数。

    请注意

    当使用creditscorecard名称-值参数“BinMissingData”的价值真正的缺失的数据,数字和分类预测是封存在一个单独的标签<失踪>。的<失踪>本只包含缺失值预测和不包含无效或超出范围值预测。

数据类型:字符

指标是否轮点分数,指定为逗号分隔组成的“圆”和值特征向量“AllPoints”,“FinalScore”“没有”,地点:

  • 没有一个——没有舍入。

  • AllPoints之前——舍入适用于每个预测的分加起来的总得分。

  • FinalScore应用——只在最后得分(四舍五入后所有点都加起来)。

为更多的信息和使用的一个例子“圆”名称-值对论点,明白了舍入和违约概率

数据类型:字符

指标转变为信用计分卡和斜率缩放参数,指定为逗号分隔组成的“ShiftAndSlope”和一个数字和两个元素数组(转变,斜率)不能为零。的ShiftAndSlope值是使用量表评分模型。

请注意

ShiftAndSlope,PointsOddsAndPDO,WorstAndBestScores扩展方法,你可以只使用一个名称-值对参数。其他三个名称-值对参数(BasePoints,失踪,)不扩展方法,可以一起使用或与任何三个扩展方法之一。

删除前一个缩放和回归们分数,集ShiftAndSlope[0,1]

数据类型:

指标为目标点()对于一个给定的概率水平(几率)和所需的点数的几率翻倍(PDO),指定为逗号分隔组成的“PointsOddsAndPDO”和一个数字三个元素的数组(点,几率,PDO)几率必须是一个正数。的PointsOddsAndPDO值被用来找到得分的比例参数模型。

请注意

点几率的两倍(PDO)可能是积极的还是消极的,这取决于更高的分数意味着风险降低,反之亦然。

ShiftAndSlope,PointsOddsAndPDO,WorstAndBestScores扩展方法,你可以只使用一个名称-值对参数。其他三个名称-值对参数(BasePoints,失踪,)不扩展方法,可以一起使用或与任何三个扩展方法之一。

删除前一个缩放和回归们分数,集ShiftAndSlope[0,1]

数据类型:

指标最差(风险最高)和计分卡最好的(风险)得分最低,指定为逗号分隔组成的“WorstAndBestScores”和一个数字和两个元素数组[WorstScore, BestScore]WorstScoreBestScore必须是不同的值。这些WorstAndBestScores值被用来找到得分的比例参数模型。

请注意

WorstScore意味着风险最高的分数,其价值可能是低或高于“最佳”分数。换句话说,最低的分数可能是最差的分数或“最佳”得分,得分取决于所需的规模。

ShiftAndSlope,PointsOddsAndPDO,WorstAndBestScores扩展方法,你可以只使用一个名称-值对参数。其他三个名称-值对参数(BasePoints,失踪,)不扩展方法,可以一起使用或与任何三个扩展方法之一。

删除前一个缩放和回归们分数,集ShiftAndSlope[0,1]

数据类型:

输出参数

全部折叠

信用计分卡模型作为一个更新返回creditscorecard对象。有关使用的更多信息creditscorecard对象,看到creditscorecard

算法

一个人的分数由公式给出

分数(i) = Shift +坡* (b0 + b1 * WOE1 (i) + b2 * WOE2(我)+…+ bp * WOEp(我))

在哪里bj的系数jth变量在模型中,有祸了j()是重量的证据(悲哀)值个人对应j模型变量。转变是比例常数下面将进一步讨论。比例常数可以控制formatpoints

如果个人的数据是在th排一个给定的数据集,计算得分数据(,j)是使用现有的装箱封存地图,并转换为相应的重量的证据价值有祸了j()。使用模型系数,们的分数计算

s = b0 + b1 * WOE1(我)+…+ bp * WOEp(我)。

为简单起见,假设在上面的描述jth变量的模型jth列在数据输入,尽管如此,一般来说,变量的顺序在一个给定的数据集没有匹配的顺序变量在模型中,数据集可以不使用额外的变量在模型中。

格式化选项可以控制使用formatpoints。当分别报道(见基础点formatpoints参数BasePoints),的基础点

基础分= Shift +坡* b0,
和点jth预测,th行给出的
Points_ji =坡* (bj * WOEj(我)))。

默认情况下,基本分不单独报告,在这种情况下

Points_ji = (Shift +坡* b0) / p +坡* (bj * WOEj(我)),
在哪里p在计分卡模型预测的数量。

默认情况下,不应用于点的舍入分数函数(没有一个)。如果被设置为AllPoints使用formatpoints对个人,那么这个点为变量j是由

如果舍入“AllPoints”:圆(Points_ji)
如果基础点分别报道,也是圆的。这个整数值分预测收益率,因此也整数值的分数。如果被设置为FinalScore使用formatpoints,那么分预测不是圆形的,只有最后的分数是圆形的
分数如果舍入“FinalScore”:圆形(得分(i))。

关于缩放参数,转变参数,参数可以直接与设置ShiftAndSlope参数的formatpoints。或者,您可以使用formatpoints参数WorstAndBestScores。在这种情况下,参数转变被发现在内部通过求解系统

Shift +坡*股市= WorstScore Shift + * smax = BestScore斜率,
在哪里WorstScoreBestScore第一个和第二个元素吗formatpoints参数WorstAndBestScores股市smax最小和最大可能的任何范围的分数:
股市= b0 +分钟(b1 * WOE1) +…+分钟(bp * WOEp), smax = b0 +马克斯(b1 * WOE1) +…+马克斯(bp * WOEp)。

第三种量表分数的PointsOddsAndPDO参数formatpoints。在这种情况下,假设们得分年代给出了log-odds一行,转变参数被发现通过解决以下系统

点= Shift +坡*日志(优势)点+ PDO = Shift +坡*日志(2 *几率)
在哪里,几率,PDO(“指向概率的两倍”)是第一,第二,第三个元素PointsOddsAndPDO参数。

当一个给定的数据集有一个缺失或超出范围的值数据(,j),预测的点j,对个人,将默认情况下,导致这一行(一个丢失的分数分数)。使用失踪参数formatpoints,您可以修改这个行为并设置相应的证据的效力(悲哀)值为零,或设置点的最小点,或预测的最大点。

引用

[1]安德森,R。信用评分工具包。牛津大学出版社,2007年。

[2]Refaat, M。信用风险记分卡:使用情景应用程序开发和实现。lulu.com, 2011。

版本历史

介绍了R2014b