displaypoints

返回点每个预测器每箱

描述

例子

PointsInfo= displaypoints (sc属性中使用的所有预测器变量的所有容器的点数表creditscorecard对象经过线性logistic回归模型拟合后使用fitmodel证据数据的权重。的PointsInfo表格显示预测器名称、容器标签和每个容器的对应点的信息。

例子

PointsInfoMinScoreMaxScore) = displaypoints (sc属性中使用的所有预测器变量的所有容器的点数表creditscorecard对象的线性logistic回归模型拟合后(fitmodel)到证据数据的权重。的PointsInfo表格显示预测器名称、容器标签以及每个容器和对应的点的信息displaypoints.另外,可选的MinScoreMaxScore返回值。

例子

PointsInfoMinScoreMaxScore) = displaypoints (___名称,值除了前面语法中的输入参数外,还使用一个或多个名称-值对参数指定选项。

例子

全部折叠

这个例子展示了如何使用displaypoints在一个模型被拟合,以计算每个容器的未缩放点,在creditscorecard模型。

创建一个creditscorecard对象使用CreditCardData.mat文件来加载数据(使用Refaat 2011的数据集)。使用“IDVar”论点的creditscorecard函数表示“CustID”包含ID信息,不应作为预测变量包含。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”“CustID”);

对所有预测器执行自动装箱。

sc = autobinning (sc);

使用默认参数拟合线性回归模型。

sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16

显示未缩放点的预测保留在拟合模型。

PointsInfo = displaypoints (sc)
PointsInfo =37×3表预测本点  ______________ ________________ _________ {' CustAge’}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{“CustAge”}{的[58岁的Inf]} 0.479{‘CustAge}{“失踪> <”}NaN{'EmpStatus'} {'EmpStatus'}} {'EmpStatus'}} {'EmpStatus'}} {'Employed'} 0.31449 {'EmpStatus'} {'EmpStatus'}} {'CustIncome'} {'[-Inf,29000)'}} 0.45716⋮

displaypoints总是显示一个“失踪> <”Bin为每个预测器。价值“失踪> <”Bin来源于首字母creditscorecard对象,“失踪> <”Bin设置为当记分卡模型没有关于如何给缺失数据分配分数的信息时。

为。配置点“失踪> <”Bin,必须使用首字母creditscorecard对象。对于训练集中缺失值的预测器,则“失踪> <”Bin是根据数据估计的“BinMissingData”名称-值对参数设置为真正的使用creditscorecard.当“BinMissingData”参数设置为,或当数据在训练集中不包含缺失值时,使用“失踪”中的名称-值对参数formatpoints指示如何为缺失的数据分配点。

创建一个creditscorecard对象使用CreditCardData.mat文件来加载数据用缺失值。

负载CreditCardData.mat头(dataMissing, 5)
ans =5×11表CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate地位  ______ _______ ___________ ___________ _________ __________ _______ _______ _________ ________ ______ 53 62 <定义>未知50000 55是的1055.9 - 0.22 0 2 61 22业主雇佣52000 25是的1161.6 - 0.24 0 3 47 30租户雇佣了37000 61877.23 0.29 0 4 NaN 75自雇业主53000 20是157.37 0.08 0 5 68 56自雇业主53000 14是561.84 0.11 0
流('行数:%d\n'、高度(dataMissing))
行数:1200行
流('缺少的值的数量CustAge: %d\n'总和(ismissing (dataMissing.CustAge)))
CustAge: 30
流(restatus: %d\n总和(ismissing (dataMissing.ResStatus)))
ResStatus: 40

使用creditscorecard使用name-value参数“BinMissingData”设置为真正的将丢失的数字或类别数据装入单独的容器中。应用自动装箱。

sc = creditscorecard (dataMissing,“IDVar”“CustID”“BinMissingData”,真正的);sc = autobinning (sc);disp (sc)
creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: " VarNames: {1x11 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 1 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x11 table]

显示和绘图箱信息的数字数据“CustAge”这包括在一个单独的标签箱中丢失的数据< >失踪

(bi, cp) = bininfo (sc,“CustAge”);disp (bi)
本好不好悲哀InfoValue几率  _____________ ____ ___ ______ ________ __________ {'[- 正无穷,33)52}69 1.3269 -0.42156 0.018993{[33岁,37)}63年45 1.4 -0.36795 0.012839{[37、40)}72年47 1.5319 -0.2779 0.0079824{'[40岁,46)}172 89 1.9326 -0.04556 0.0004549{'[46岁,48)}59 25 2.36 0.15424 0.0016199{[48,51)}99年41 2.4146 0.17713 0.0035449{'[51,58)'} 157 62 2.5323 0.22469 0.0088407 {'[58,Inf]'} 93 25 3.72 0.60931 0.032198 {''} 19 11 1.7273 -0.15787 0.00063885 {' total '} 803 397 2.0227 NaN 0.087112
plotbins (sc,“CustAge”

显示和绘图的分类数据的bin信息“ResStatus”这包括在一个单独的标签箱中丢失的数据< >失踪

(bi, cg) = bininfo (sc,“ResStatus”);disp (bi)
Bin Good Bad Odds WOE InfoValue ______________ _____________ _________ __________ {'Tenant'} 296 161 1.8385 -0.095463 0.0035249 {'Home Owner'} 352 171 2.0585 0.017549 0.00013382 {'Other'} 128 52 2.4615 0.19637 0.0055808 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.0092627
plotbins (sc,“ResStatus”

“CustAge”“ResStatus”预测者,有缺失的数据(nan<定义>),分箱过程估计出的WOE值为-0.157870.026469分别为这些预测器中的缺失数据,如上所示。

使用fitmodel利用证据权重(WOE)数据拟合逻辑回归模型。fitmodel在内部将所有预测变量转换为祸值,使用自动装箱过程中找到的箱子。fitmodel然后使用逐步方法(默认)拟合逻辑回归模型。对于缺少数据的预测器,有一个明确的< >失踪bin,并根据数据计算出相应的WOE值。当使用fitmodel,则在进行WOE转换时,应用 bin对应的WOE值。

(sc, mdl) = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。加CustAge, Deviance = 1442.8477, Chi2Stat = 4.4974731, PValue = 0.033944979添加ResStatus, Deviance = 1438.9783, Chi2Stat = 3.86941, PValue = 0.049173805广义线性回归模型:status ~[7个预测因子中8项的线性公式]Distribution = Binomial Estimated Coefficients:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70229 0.063959 10.98 4.7498e-28 CustAge 0.57421 0.25708 2.2335 0.025513 ResStatus 1.3629 0.66952 2.0356 0.04179 EmpStatus 0.88373 0.2929 3.0172 0.002551 CustIncome 0.73535 0.2159 3.406 0.00065929 TmWBank 1.1065 0.23267 4.7556 1.9783e-06 OtherCC 1.0648 0.52826 2.0156 0.043841AMBalance 1.0446 0.32197 3.2443 0.0011775 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 88.5, p-value = 2.55e-16

显示未缩放点的预测保留在拟合模型(以缩放点使用formatpoints).

PointsInfo = displaypoints (sc)
PointsInfo =38×3表预测本点  _____________ ______________ _________ {' CustAge’}{[无穷,33)的-0.14173}{‘CustAge}{[33岁,37)的-0.11095}{‘CustAge}{[37、40)的-0.059244}{‘CustAge}{[40岁,46)的0.074167}{‘CustAge}{[46岁,48)的0.1889}{‘CustAge}{[48, 51)的0.20204}{‘CustAge}{[51岁,58)的0.22935}{‘CustAge}{[58岁的Inf]的}{0.45019“CustAge”} {'' } 0.0096749 {'ResStatus'} {'Tenant' } -0.029778 {'ResStatus'} {'Home Owner'} 0.12425 {'ResStatus'} {'Other' } 0.36796 {'ResStatus'} {'' } 0.1364 {'EmpStatus'} {'Unknown' } -0.075948 {'EmpStatus'} {'Employed' } 0.31401 {'EmpStatus'} {'' } NaN ⋮

注意这个点< >失踪本为CustAgeResStatus明确显示。这些点是根据<缺失> bin的WOE值和logistic模型系数计算出来的。

对于训练集中没有缺失数据的预测器,没有显式的< >失踪Bin,默认情况下,这些点被设置为因为缺少数据,他们会导致运行时分数.对于没有明确的预测器< >失踪Bin,使用name-value参数“失踪”formatpoints以指示如何处理缺失的数据进行评分。

这个例子展示了如何使用formatpoints将模型拟合后格式化成比例点,然后使用displaypoints为给定的预测器显示每个容器的缩放点creditscorecard模型。

当一个范围被定义时,点被缩放。具体地说,从未缩放点到缩放点的线性变换是必要的。这种转换可以通过提供移位和斜率或指定可能的最差和最好的分数来定义。(有关更多信息,请参见formatpoints.)

创建一个creditscorecard对象使用CreditCardData.mat文件来加载数据(使用Refaat 2011的数据集)。使用“IDVar”论点的creditscorecard函数表示“CustID”包含ID信息,不应作为预测变量包含。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”“CustID”);

对所有预测器执行自动装箱。

sc = autobinning (sc);

使用默认参数拟合线性回归模型。

sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16

使用formatpoints函数来缩放“坏的”“最佳”分数值。下面提供的范围是一个通用的分数范围。

sc = formatpoints (sc,“WorstAndBestScores”850年[300]);

再次显示分数信息,以验证分数现在是缩放的,也显示缩放的最低和最高分数。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表预测本点  ______________ ________________ ______ {' CustAge’}{[无穷,33)的46.396}{‘CustAge}{[33岁,37)的48.727}{‘CustAge}{[37、40)的58.772}{‘CustAge}{[40岁,46)的72.167}{‘CustAge}{[46岁,48)的93.256}{‘CustAge}{[48, 58)的95.256}{“CustAge”}{的[58岁的Inf]} 126.46{‘CustAge}{“失踪> <”}南{' ResStatus '}{'EmpStatus'} {'EmpStatus'} {'Employed'} 105.81 {'EmpStatus'} {'EmpStatus'} {'CustIncome'} {'[-Inf,29000)'}} 8.9706⋮
MinScore = 300.0000
MaxScore = 850

请注意,如预期的那样MinScoreMaxScore对应的可能是最差和最好的分数。

这个例子展示了如何使用displaypoints模型拟合后,将基点与分配给每个预测变量的其余点分开。名称-值对参数“BasePoints”formatpoints函数是一个用于此目的的布尔值。默认情况下,基点分布在记分卡的所有变量中。

创建一个creditscorecard对象使用CreditCardData.mat文件来加载数据(使用Refaat 2011的数据集)。使用“IDVar”论点的creditscorecard函数表示“CustID”包含ID信息,不应作为预测变量包含。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”“CustID”);

对所有预测器执行自动装箱。

sc = autobinning (sc);

使用默认参数拟合线性回归模型。

sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16

使用formatpoints函数来分隔基点“BasePoints”名称-值对的论点。

sc = formatpoints (sc,“BasePoints”,真正的);

显示拟合模型中保留的预测器的基准点(从其他点中分离出来)。

PointsInfo = displaypoints (sc)
PointsInfo =38×3表预测本点  ______________ ______________ _________ {' BasePoints}{‘BasePoints} 0.70239{‘CustAge}{[无穷,33)的-0.25928}{‘CustAge}{[33岁,37)的-0.24071}{‘CustAge}{[37、40)的-0.16066}{‘CustAge}{[40岁,46)的-0.053933}{‘CustAge}{[46岁,48)的0.11411}{‘CustAge}{[48, 58)的0.13005}{“CustAge”}{的[58岁的Inf]} 0.37866{'ResStatus'} {' status '} {'Home Owner'} 0.026616 {'ResStatus'} {'Other'} 0.27607 {'ResStatus'} {'ResStatus'} {'Other'} 0.27607 {'ResStatus'} {'EmpStatus'} {'Unknown'} -0.17666 {'EmpStatus'} {'Employed'} 0.21415 {'EmpStatus'} {''} NaN⋮

这个例子展示了如何使用displaypoints模型拟合后modifybins函数用于为数字预测器提供用户定义的bin标签。

创建一个creditscorecard对象使用CreditCardData.mat文件来加载数据(使用Refaat 2011的数据集)。使用“IDVar”论点的creditscorecard函数表示“CustID”包含ID信息,不应作为预测变量包含。

负载CreditCardDatasc = creditscorecard(数据,“IDVar”“CustID”);

对所有预测器执行自动装箱。

sc = autobinning (sc);

使用默认参数拟合线性回归模型。

sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16

使用displaypoints功能显示点信息。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表预测本点  ______________ ________________ _________ {' CustAge’}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{“CustAge”}{的[58岁的Inf]} 0.479{‘CustAge}{“失踪> <”}NaN{'EmpStatus'} {'EmpStatus'}} {'EmpStatus'}} {'EmpStatus'}} {'Employed'} 0.31449 {'EmpStatus'} {'EmpStatus'}} {'CustIncome'} {'[-Inf,29000)'}} 0.45716⋮
MinScore = -1.3100
MaxScore = 3.0726

使用modifybins函数指定用户定义的容器标签“CustAge”所以bin范围是用自然语言描述的。

标签= {多达32的33个36的37到39的40到45的“46 47”“48 57”“至少58”};sc = modifybins (sc,“CustAge”“BinLabels”、标签);

重新运行displaypoints验证更新后的容器标签。

[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表预测本点  ______________ ________________ _________ {' CustAge}{‘多达32}-0.15894{‘CustAge}{' 33 36} -0.14036{‘CustAge}{' 37到39}-0.060323{‘CustAge}{40到45的}0.046408{‘CustAge}{“46 47”}0.21445{‘CustAge}{“48 57”}0.23039{‘CustAge}{'至少58}0.479{‘CustAge}{“失踪> <”}NaN{'EmpStatus'} {'EmpStatus'}} {'EmpStatus'}} {'EmpStatus'}} {'Employed'} 0.31449 {'EmpStatus'} {'EmpStatus'}} {'CustIncome'} {'[-Inf,29000)'}} 0.45716⋮
MinScore = -1.3100
MaxScore = 3.0726

这个例子展示了如何使用信用记分卡来计算预测者的权重。预测器的权重由每个预测器的积分范围除以记分卡的总积分范围来确定。记分卡的积分不仅考虑了beta,而且隐含地考虑了预测值的分类和相应的证据权重。

创建一个记分卡。

负载CreditCardData.matsc = creditscorecard(数据,“IDVar”“CustID”);sc = autobinning (sc);sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16

计算记分卡点数和MinPtsMaxPts分数。

sc = formatpoints (sc,“PointsOddsAndPDO”, (500 2));[PointsTable, MinPts MaxPts] = displaypoints (sc);PtsRange = MaxPts-MinPts;: disp (PointsTable (1:10));
预测本点  _____________ ______________ ______ {' CustAge’}{[无穷,33)的52.821}{‘CustAge}{[33岁,37)的54.161}{‘CustAge}{[37、40)的59.934}{‘CustAge}{[40岁,46)的67.633}{‘CustAge}{[46岁,48)的79.755}{‘CustAge}{[48, 58)的80.905}{“CustAge”}{的[58岁的Inf]} 98.838{‘CustAge}{“失踪> <”}南{‘ResStatus}{“租户”}62.031 {'ResStatus'} {'Home Owner'
流('最小值:%g,最大值:%g\n'、MinPts MaxPts);
最低得分:355.505,最高得分:671.64

计算预测器的权重。

预测(PointsTable =独一无二的。预测,“稳定”);NumPred =长度(预测);重量= 0 (NumPred, 1);ii=1:NumPred Ind = cellfun(@(x)strcmpi(Predictor{ii},x),PointsTable.Predictors);MaxPtsPred = max (PointsTable.Points(印第安纳州));MinPtsPred = min (PointsTable.Points(印第安纳州));重量(ii) = 100 * (MaxPtsPred-MinPtsPred) / PtsRange;结束PredictorWeights =表(预测、重量);PredictorWeights (+ 1,:) = PredictorWeights(最终:);PredictorWeights。预测{结束}=“总”;PredictorWeights.Weight(结束)=(重量)总和;disp (PredictorWeights)
预测器权重______________ ______ {'CustAge'} 14.556 {'ResStatus'} 9.302 {'EmpStatus'} 8.9174 {'CustIncome'} 20.401 {'TmWBank'} 25.884 {'OtherCC'} 7.9885 {'AMBalance'} 12.951 {'Total'} 100

权重定义为预测器的积分范围除以记分卡的积分范围。

创建一个creditscorecard对象使用CreditCardData.mat文件,加载数据(使用Refaat 2011的数据集)。使用dataMissing数据集,设置“BinMissingData”指标真正的

负载CreditCardData.matsc = creditscorecard (dataMissing,“BinMissingData”,真正的);

使用autobinningcreditscorecard对象。

sc = autobinning (sc);

分类数据的分类映射或规则汇总在一个“类别分组”表中,作为可选输出返回。默认情况下,每个类别都放在一个单独的容器中。这是预测者的信息ResStatus

(bi, cg) = bininfo (sc,“ResStatus”
bi =5×6表Bin Good Bad Odds WOE InfoValue ______________ _____________ _________ __________ {'Tenant'} 296 161 1.8385 -0.095463 0.0035249 {'Home Owner'} 352 171 2.0585 0.017549 0.00013382 {'Other'} 128 52 2.4615 0.19637 0.0055808 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.0092627
cg =3×2表类别BinNumber  ______________ _________ {' 租户'}1{‘业主’}2{‘其他’}3

组类别“租户”“其他”,修改类别分组表cg,则为“其他”与箱号相同吗“租户”.然后使用modifybins更新creditscorecard对象。

cg.BinNumber (3) = 2;sc = modifybins (sc,“ResStatus”“Catg”、cg);

显示更新的bin信息使用bininfo.请注意,已更新了bin标签,类别分组中包含了bin成员资格信息cg

(bi, cg) = bininfo (sc,“ResStatus”
bi =4×6表Bin Good Bad Odds WOE InfoValue _____________ _____________ _________ __________ {'Group1'} 296 161 1.8383 -0.095463 0.0035249 {'Group2'} 480 223 2.1525 0.062196 0.0022419 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.00579
cg =3×2表类别BinNumber  ______________ _________ {' 租户'}1{‘业主’}2{‘其他’}2

使用formatpoints“失踪”名称-值对参数,指示已分配丢失的数据“maxpoints”

sc = formatpoints (sc,“BasePoints”,真的,“失踪”“maxpoints”“WorstAndBest”800年[300]);

使用fitmodel以适应模型。

sc = fitmodel (sc,“VariableSelection”“fullmodel”“显示”“关闭”);

然后使用displaypointscreditscorecard对象中使用的所有预测器变量的所有容器的点数表compactCreditScorecard对象。通过设置displaypoints'的名称-值对参数ShowCategoricalMembers”真正的,则显示每个单独组中包含的所有成员。

[PointsInfo, MinScore MaxScore] = displaypoints (sc,“ShowCategoricalMembers”,真正的)
PointsInfo =51×3表预测本点  _______________ ______________ _______ {' BasePoints}{‘BasePoints} 535.25 {CustID的}{[无穷,121)的12.085}{CustID的}{5.4738”(121241)“}{CustID的}{[241、1081)的-1.4061}{CustID的}{”(1081年,正)}-7.2217 {CustID的}{“失踪> <”}12.085{‘CustAge}{[无穷,33)的-25.973}{‘CustAge}{'[33岁,37)}{-22.67“CustAge”} {'[37,40)' } -17.122 {'CustAge' } {'[40,46)' } -2.8071 {'CustAge' } {'[46,48)' } 9.5034 {'CustAge' } {'[48,51)' } 10.913 {'CustAge' } {'[51,58)' } 13.844 {'CustAge' } {'[58,Inf]' } 37.541 {'CustAge' } {'' } -9.7271 {'TmAtAddress'} {'[-Inf,23)' } -9.3683 ⋮
MinScore = 300.0000
MaxScore = 800

输入参数

全部折叠

信用记分卡模型,指定为creditscorecard对象。使用creditscorecard创建一个creditscorecard对象。

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:[PointsInfo, MinScore MaxScore] = displaypoints (sc, ShowCategoricalMembers,真的)

指示符,用于显示分组在一起的类别的容器标签,指定为由逗号分隔的对组成“ShowCategoricalMembers”和一个值为的逻辑标量真正的

默认情况下,当“ShowCategoricalMembers”, bin标签显示为Group1Group2、……集团n,或是否修改了容器标签creditscorecard,则显示用户定义的bin标签名。

如果“ShowCategoricalMembers”真正的,则显示每个单独组中包含的所有成员。

数据类型:逻辑

输出参数

全部折叠

每个bin、每个预测器一行,带有相应的点,作为表返回。例如:

预测 箱子
Predictor_1 Bin_11 Points_11
Predictor_1 Bin_12 Points_12
Predictor_1 Bin_13 Points_13
... ...
Predictor_1 “失踪> <” (默认)
Predictor_2 Bin_21 Points_21
Predictor_2 Bin_22 Points_22
Predictor_2 Bin_23 Points_23
... ...
Predictor_2 “失踪> <” (默认)
Predictor_j Bin_j Points_j
... ...
Predictor_j “失踪> <” (默认)

displaypoints总是显示一个“失踪> <”Bin为每个预测器。价值“失踪> <”Bin来源于首字母creditscorecard对象,“失踪> <”Bin设置为当记分卡模型没有关于如何给缺失数据分配分数的信息时。

为。配置点“失踪> <”Bin,必须使用首字母creditscorecard对象。对于训练集中缺失值的预测器,则“失踪> <”Bin是根据数据估计的“BinMissingData”名称-值对参数设置为真正的使用creditscorecard.当“BinMissingData”参数设置为,或当数据在训练集中不包含缺失值时,使用“失踪”中的名称-值对参数formatpoints指示如何为缺失的数据分配点。

当基点单独报告时(见formatpoints),返回的第一行PointsInfo表中包含基准点。

最小可能的总分,作为标量返回。

请注意

最低分数是数学意义上可能的最低总分,与低分数是否意味着高风险或低风险无关。

可能的最大总分,作为标量返回。

请注意

最高分数是数学意义上可能的最高总分,与高分是否意味着高风险或低风险无关。

算法

预测点j和本默认为

Points_ji = (Shift + Slope*b0)/p + Slope*(bj*WOEj(i))
在哪里bj模型系数是预测器吗jp是模型中预测因子的数量,和WOEj)是证据权重(WOE)的价值对应的j模型预测。转变是比例常数。

当基线点单独报告时(见formatpoints名称-值对的观点BasePoints),基点为

基点=位移+斜率*b0,
积分是jth预测,-第一行是
Points_ji =坡* (bj * WOEj(我)))。

默认情况下,不单独报告基准点。

最低分和最高分分别为:

MinScore = Shift + Slope*b0 + min(Slope*b1*WOE1) +…+min(Slope*bp*WOEp)), MaxScore = Shift + Slope*b0 + max(Slope*b1*WOE1) +…+马克斯(斜率* bp * WOEp))。

使用formatpoints控制点缩放、四舍五入的方式,以及是否单独报告基准点。看到formatpoints有关格式参数的更多信息,以及有关这些格式选项的详细信息和公式。

参考文献

[1]安德森,R。信用评分工具包。牛津大学出版社,2007。

[2] Refaat, M。信用风险记分卡:使用SAS开发和实施。lulu.com, 2011。

介绍了R2014b