返回点每个预测器每箱
属性中使用的所有预测器变量的所有容器的点数表PointsInfo
= displaypoints (sc
)creditscorecard
对象经过线性logistic回归模型拟合后使用fitmodel
证据数据的权重。的PointsInfo
表格显示预测器名称、容器标签和每个容器的对应点的信息。
[
属性中使用的所有预测器变量的所有容器的点数表PointsInfo
,MinScore
,MaxScore
) = displaypoints (sc
)creditscorecard
对象的线性logistic回归模型拟合后(fitmodel
)到证据数据的权重。的PointsInfo
表格显示预测器名称、容器标签以及每个容器和对应的点的信息displaypoints
.另外,可选的MinScore
和MaxScore
返回值。
[
除了前面语法中的输入参数外,还使用一个或多个名称-值对参数指定选项。PointsInfo
,MinScore
,MaxScore
) = displaypoints (___,名称,值
)
这个例子展示了如何使用displaypoints
在一个模型被拟合,以计算每个容器的未缩放点,在creditscorecard
模型。
创建一个creditscorecard
对象使用CreditCardData.mat
文件来加载数据
(使用Refaat 2011的数据集)。使用“IDVar”
论点的creditscorecard
函数表示“CustID”
包含ID信息,不应作为预测变量包含。
负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);
对所有预测器执行自动装箱。
sc = autobinning (sc);
使用默认参数拟合线性回归模型。
sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16
显示未缩放点的预测保留在拟合模型。
PointsInfo = displaypoints (sc)
PointsInfo =37×3表预测本点 ______________ ________________ _________ {' CustAge’}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{“CustAge”}{的[58岁的Inf]} 0.479{‘CustAge}{“失踪> <”}NaN{'EmpStatus'} {'EmpStatus'}} {'EmpStatus'}} {'EmpStatus'}} {'Employed'} 0.31449 {'EmpStatus'} {'EmpStatus'}} {'CustIncome'} {'[-Inf,29000)'}} 0.45716⋮
displaypoints
总是显示一个“失踪> <”
Bin为每个预测器。价值“失踪> <”
Bin来源于首字母creditscorecard
对象,“失踪> <”
Bin设置为南
当记分卡模型没有关于如何给缺失数据分配分数的信息时。
为。配置点“失踪> <”
Bin,必须使用首字母creditscorecard
对象。对于训练集中缺失值的预测器,则“失踪> <”
Bin是根据数据估计的“BinMissingData”
名称-值对参数设置为真正的
使用creditscorecard
.当“BinMissingData”
参数设置为假
,或当数据在训练集中不包含缺失值时,使用“失踪”
中的名称-值对参数formatpoints
指示如何为缺失的数据分配点。
创建一个creditscorecard
对象使用CreditCardData.mat
文件来加载数据
用缺失值。
负载CreditCardData.mat头(dataMissing, 5)
ans =5×11表CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate地位 ______ _______ ___________ ___________ _________ __________ _______ _______ _________ ________ ______ 53 62 <定义>未知50000 55是的1055.9 - 0.22 0 2 61 22业主雇佣52000 25是的1161.6 - 0.24 0 3 47 30租户雇佣了37000 61877.23 0.29 0 4 NaN 75自雇业主53000 20是157.37 0.08 0 5 68 56自雇业主53000 14是561.84 0.11 0
流('行数:%d\n'、高度(dataMissing))
行数:1200行
流('缺少的值的数量CustAge: %d\n'总和(ismissing (dataMissing.CustAge)))
CustAge: 30
流(restatus: %d\n总和(ismissing (dataMissing.ResStatus)))
ResStatus: 40
使用creditscorecard
使用name-value参数“BinMissingData”
设置为真正的
将丢失的数字或类别数据装入单独的容器中。应用自动装箱。
sc = creditscorecard (dataMissing,“IDVar”,“CustID”,“BinMissingData”,真正的);sc = autobinning (sc);disp (sc)
creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: " VarNames: {1x11 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 1 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x11 table]
显示和绘图箱信息的数字数据“CustAge”
这包括在一个单独的标签箱中丢失的数据< >失踪
.
(bi, cp) = bininfo (sc,“CustAge”);disp (bi)
本好不好悲哀InfoValue几率 _____________ ____ ___ ______ ________ __________ {'[- 正无穷,33)52}69 1.3269 -0.42156 0.018993{[33岁,37)}63年45 1.4 -0.36795 0.012839{[37、40)}72年47 1.5319 -0.2779 0.0079824{'[40岁,46)}172 89 1.9326 -0.04556 0.0004549{'[46岁,48)}59 25 2.36 0.15424 0.0016199{[48,51)}99年41 2.4146 0.17713 0.0035449{'[51,58)'} 157 62 2.5323 0.22469 0.0088407 {'[58,Inf]'} 93 25 3.72 0.60931 0.032198 {''} 19 11 1.7273 -0.15787 0.00063885 {' total '} 803 397 2.0227 NaN 0.087112
plotbins (sc,“CustAge”)
显示和绘图的分类数据的bin信息“ResStatus”
这包括在一个单独的标签箱中丢失的数据< >失踪
.
(bi, cg) = bininfo (sc,“ResStatus”);disp (bi)
Bin Good Bad Odds WOE InfoValue ______________ _____________ _________ __________ {'Tenant'} 296 161 1.8385 -0.095463 0.0035249 {'Home Owner'} 352 171 2.0585 0.017549 0.00013382 {'Other'} 128 52 2.4615 0.19637 0.0055808 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.0092627
plotbins (sc,“ResStatus”)
为“CustAge”
和“ResStatus”
预测者,有缺失的数据(nan
和<定义>
),分箱过程估计出的WOE值为-0.15787
和0.026469
分别为这些预测器中的缺失数据,如上所示。
使用fitmodel
利用证据权重(WOE)数据拟合逻辑回归模型。fitmodel
在内部将所有预测变量转换为祸值,使用自动装箱过程中找到的箱子。fitmodel
然后使用逐步方法(默认)拟合逻辑回归模型。对于缺少数据的预测器,有一个明确的< >失踪
bin,并根据数据计算出相应的WOE值。当使用fitmodel
,则在进行WOE转换时,应用
(sc, mdl) = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。加CustAge, Deviance = 1442.8477, Chi2Stat = 4.4974731, PValue = 0.033944979添加ResStatus, Deviance = 1438.9783, Chi2Stat = 3.86941, PValue = 0.049173805广义线性回归模型:status ~[7个预测因子中8项的线性公式]Distribution = Binomial Estimated Coefficients:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70229 0.063959 10.98 4.7498e-28 CustAge 0.57421 0.25708 2.2335 0.025513 ResStatus 1.3629 0.66952 2.0356 0.04179 EmpStatus 0.88373 0.2929 3.0172 0.002551 CustIncome 0.73535 0.2159 3.406 0.00065929 TmWBank 1.1065 0.23267 4.7556 1.9783e-06 OtherCC 1.0648 0.52826 2.0156 0.043841AMBalance 1.0446 0.32197 3.2443 0.0011775 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 88.5, p-value = 2.55e-16
显示未缩放点的预测保留在拟合模型(以缩放点使用formatpoints
).
PointsInfo = displaypoints (sc)
PointsInfo =38×3表预测本点 _____________ ______________ _________ {' CustAge’}{[无穷,33)的-0.14173}{‘CustAge}{[33岁,37)的-0.11095}{‘CustAge}{[37、40)的-0.059244}{‘CustAge}{[40岁,46)的0.074167}{‘CustAge}{[46岁,48)的0.1889}{‘CustAge}{[48, 51)的0.20204}{‘CustAge}{[51岁,58)的0.22935}{‘CustAge}{[58岁的Inf]的}{0.45019“CustAge”} {'' } 0.0096749 {'ResStatus'} {'Tenant' } -0.029778 {'ResStatus'} {'Home Owner'} 0.12425 {'ResStatus'} {'Other' } 0.36796 {'ResStatus'} {' ' } 0.1364 {'EmpStatus'} {'Unknown' } -0.075948 {'EmpStatus'} {'Employed' } 0.31401 {'EmpStatus'} {' ' } NaN ⋮
注意这个点< >失踪
本为CustAge
和ResStatus
明确显示。这些点是根据<缺失> bin的WOE值和logistic模型系数计算出来的。
对于训练集中没有缺失数据的预测器,没有显式的< >失踪
Bin,默认情况下,这些点被设置为南
因为缺少数据,他们会导致南
运行时分数
.对于没有明确的预测器< >失踪
Bin,使用name-value参数“失踪”
在formatpoints
以指示如何处理缺失的数据进行评分。
这个例子展示了如何使用formatpoints
将模型拟合后格式化成比例点,然后使用displaypoints
为给定的预测器显示每个容器的缩放点creditscorecard
模型。
当一个范围被定义时,点被缩放。具体地说,从未缩放点到缩放点的线性变换是必要的。这种转换可以通过提供移位和斜率或指定可能的最差和最好的分数来定义。(有关更多信息,请参见formatpoints
.)
创建一个creditscorecard
对象使用CreditCardData.mat
文件来加载数据
(使用Refaat 2011的数据集)。使用“IDVar”
论点的creditscorecard
函数表示“CustID”
包含ID信息,不应作为预测变量包含。
负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);
对所有预测器执行自动装箱。
sc = autobinning (sc);
使用默认参数拟合线性回归模型。
sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16
使用formatpoints
函数来缩放“坏的”
和“最佳”
分数值。下面提供的范围是一个通用的分数范围。
sc = formatpoints (sc,“WorstAndBestScores”850年[300]);
再次显示分数信息,以验证分数现在是缩放的,也显示缩放的最低和最高分数。
[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表预测本点 ______________ ________________ ______ {' CustAge’}{[无穷,33)的46.396}{‘CustAge}{[33岁,37)的48.727}{‘CustAge}{[37、40)的58.772}{‘CustAge}{[40岁,46)的72.167}{‘CustAge}{[46岁,48)的93.256}{‘CustAge}{[48, 58)的95.256}{“CustAge”}{的[58岁的Inf]} 126.46{‘CustAge}{“失踪> <”}南{' ResStatus '}{'EmpStatus'} {'EmpStatus'} {'Employed'} 105.81 {'EmpStatus'} {'EmpStatus'} {'CustIncome'} {'[-Inf,29000)'}} 8.9706⋮
MinScore = 300.0000
MaxScore = 850
请注意,如预期的那样MinScore
和MaxScore
对应的可能是最差和最好的分数。
这个例子展示了如何使用displaypoints
模型拟合后,将基点与分配给每个预测变量的其余点分开。名称-值对参数“BasePoints”
在formatpoints
函数是一个用于此目的的布尔值。默认情况下,基点分布在记分卡的所有变量中。
创建一个creditscorecard
对象使用CreditCardData.mat
文件来加载数据
(使用Refaat 2011的数据集)。使用“IDVar”
论点的creditscorecard
函数表示“CustID”
包含ID信息,不应作为预测变量包含。
负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);
对所有预测器执行自动装箱。
sc = autobinning (sc);
使用默认参数拟合线性回归模型。
sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16
使用formatpoints
函数来分隔基点“BasePoints”
名称-值对的论点。
sc = formatpoints (sc,“BasePoints”,真正的);
显示拟合模型中保留的预测器的基准点(从其他点中分离出来)。
PointsInfo = displaypoints (sc)
PointsInfo =38×3表预测本点 ______________ ______________ _________ {' BasePoints}{‘BasePoints} 0.70239{‘CustAge}{[无穷,33)的-0.25928}{‘CustAge}{[33岁,37)的-0.24071}{‘CustAge}{[37、40)的-0.16066}{‘CustAge}{[40岁,46)的-0.053933}{‘CustAge}{[46岁,48)的0.11411}{‘CustAge}{[48, 58)的0.13005}{“CustAge”}{的[58岁的Inf]} 0.37866{'ResStatus'} {' status '} {'Home Owner'} 0.026616 {'ResStatus'} {'Other'} 0.27607 {'ResStatus'} {'ResStatus'} {'Other'} 0.27607 {'ResStatus'} {'EmpStatus'} {'Unknown'} -0.17666 {'EmpStatus'} {'Employed'} 0.21415 {'EmpStatus'} {''} NaN⋮
这个例子展示了如何使用displaypoints
模型拟合后modifybins
函数用于为数字预测器提供用户定义的bin标签。
创建一个creditscorecard
对象使用CreditCardData.mat
文件来加载数据
(使用Refaat 2011的数据集)。使用“IDVar”
论点的creditscorecard
函数表示“CustID”
包含ID信息,不应作为预测变量包含。
负载CreditCardDatasc = creditscorecard(数据,“IDVar”,“CustID”);
对所有预测器执行自动装箱。
sc = autobinning (sc);
使用默认参数拟合线性回归模型。
sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16
使用displaypoints
功能显示点信息。
[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表预测本点 ______________ ________________ _________ {' CustAge’}{[无穷,33)的-0.15894}{‘CustAge}{[33岁,37)的-0.14036}{‘CustAge}{[37、40)的-0.060323}{‘CustAge}{[40岁,46)的0.046408}{‘CustAge}{[46岁,48)的0.21445}{‘CustAge}{[48, 58)的0.23039}{“CustAge”}{的[58岁的Inf]} 0.479{‘CustAge}{“失踪> <”}NaN{'EmpStatus'} {'EmpStatus'}} {'EmpStatus'}} {'EmpStatus'}} {'Employed'} 0.31449 {'EmpStatus'} {'EmpStatus'}} {'CustIncome'} {'[-Inf,29000)'}} 0.45716⋮
MinScore = -1.3100
MaxScore = 3.0726
使用modifybins
函数指定用户定义的容器标签“CustAge”
所以bin范围是用自然语言描述的。
标签= {多达32的,33个36的,37到39的,40到45的,“46 47”,“48 57”,“至少58”};sc = modifybins (sc,“CustAge”,“BinLabels”、标签);
重新运行displaypoints
验证更新后的容器标签。
[PointsInfo, MinScore MaxScore] = displaypoints (sc)
PointsInfo =37×3表预测本点 ______________ ________________ _________ {' CustAge}{‘多达32}-0.15894{‘CustAge}{' 33 36} -0.14036{‘CustAge}{' 37到39}-0.060323{‘CustAge}{40到45的}0.046408{‘CustAge}{“46 47”}0.21445{‘CustAge}{“48 57”}0.23039{‘CustAge}{'至少58}0.479{‘CustAge}{“失踪> <”}NaN{'EmpStatus'} {'EmpStatus'}} {'EmpStatus'}} {'EmpStatus'}} {'Employed'} 0.31449 {'EmpStatus'} {'EmpStatus'}} {'CustIncome'} {'[-Inf,29000)'}} 0.45716⋮
MinScore = -1.3100
MaxScore = 3.0726
这个例子展示了如何使用信用记分卡来计算预测者的权重。预测器的权重由每个预测器的积分范围除以记分卡的总积分范围来确定。记分卡的积分不仅考虑了beta,而且隐含地考虑了预测值的分类和相应的证据权重。
创建一个记分卡。
负载CreditCardData.matsc = creditscorecard(数据,“IDVar”,“CustID”);sc = autobinning (sc);sc = fitmodel (sc);
1.加上CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601增加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257 5。添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078广义线性回归模型:状态~[7个预测因子中8项的线性公式]分布=二项式估计系数:Estimate SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.064001 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16
计算记分卡点数和MinPts
和MaxPts
分数。
sc = formatpoints (sc,“PointsOddsAndPDO”, (500 2));[PointsTable, MinPts MaxPts] = displaypoints (sc);PtsRange = MaxPts-MinPts;: disp (PointsTable (1:10));
预测本点 _____________ ______________ ______ {' CustAge’}{[无穷,33)的52.821}{‘CustAge}{[33岁,37)的54.161}{‘CustAge}{[37、40)的59.934}{‘CustAge}{[40岁,46)的67.633}{‘CustAge}{[46岁,48)的79.755}{‘CustAge}{[48, 58)的80.905}{“CustAge”}{的[58岁的Inf]} 98.838{‘CustAge}{“失踪> <”}南{‘ResStatus}{“租户”}62.031 {'ResStatus'} {'Home Owner'
流('最小值:%g,最大值:%g\n'、MinPts MaxPts);
最低得分:355.505,最高得分:671.64
计算预测器的权重。
预测(PointsTable =独一无二的。预测,“稳定”);NumPred =长度(预测);重量= 0 (NumPred, 1);为ii=1:NumPred Ind = cellfun(@(x)strcmpi(Predictor{ii},x),PointsTable.Predictors);MaxPtsPred = max (PointsTable.Points(印第安纳州));MinPtsPred = min (PointsTable.Points(印第安纳州));重量(ii) = 100 * (MaxPtsPred-MinPtsPred) / PtsRange;结束PredictorWeights =表(预测、重量);PredictorWeights (+ 1,:) = PredictorWeights(最终:);PredictorWeights。预测{结束}=“总”;PredictorWeights.Weight(结束)=(重量)总和;disp (PredictorWeights)
预测器权重______________ ______ {'CustAge'} 14.556 {'ResStatus'} 9.302 {'EmpStatus'} 8.9174 {'CustIncome'} 20.401 {'TmWBank'} 25.884 {'OtherCC'} 7.9885 {'AMBalance'} 12.951 {'Total'} 100
权重定义为预测器的积分范围除以记分卡的积分范围。
creditscorecard
包含丢失数据的对象创建一个creditscorecard
对象使用CreditCardData.mat
文件,加载数据
(使用Refaat 2011的数据集)。使用dataMissing
数据集,设置“BinMissingData”
指标真正的
.
负载CreditCardData.matsc = creditscorecard (dataMissing,“BinMissingData”,真正的);
使用autobinning
与creditscorecard
对象。
sc = autobinning (sc);
分类数据的分类映射或规则汇总在一个“类别分组”表中,作为可选输出返回。默认情况下,每个类别都放在一个单独的容器中。这是预测者的信息ResStatus
.
(bi, cg) = bininfo (sc,“ResStatus”)
bi =5×6表Bin Good Bad Odds WOE InfoValue ______________ _____________ _________ __________ {'Tenant'} 296 161 1.8385 -0.095463 0.0035249 {'Home Owner'} 352 171 2.0585 0.017549 0.00013382 {'Other'} 128 52 2.4615 0.19637 0.0055808 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.0092627
cg =3×2表类别BinNumber ______________ _________ {' 租户'}1{‘业主’}2{‘其他’}3
组类别“租户”
和“其他”
,修改类别分组表cg
,则为“其他”
与箱号相同吗“租户”
.然后使用modifybins
更新creditscorecard
对象。
cg.BinNumber (3) = 2;sc = modifybins (sc,“ResStatus”,“Catg”、cg);
显示更新的bin信息使用bininfo
.请注意,已更新了bin标签,类别分组中包含了bin成员资格信息cg
.
(bi, cg) = bininfo (sc,“ResStatus”)
bi =4×6表Bin Good Bad Odds WOE InfoValue _____________ _____________ _________ __________ {'Group1'} 296 161 1.8383 -0.095463 0.0035249 {'Group2'} 480 223 2.1525 0.062196 0.0022419 {''} 27 13 2.0769 0.026469 2.3248e-05 {' total '} 803 397 2.0227 NaN 0.00579
cg =3×2表类别BinNumber ______________ _________ {' 租户'}1{‘业主’}2{‘其他’}2
使用formatpoints
与“失踪”
名称-值对参数,指示已分配丢失的数据“maxpoints”
.
sc = formatpoints (sc,“BasePoints”,真的,“失踪”,“maxpoints”,“WorstAndBest”800年[300]);
使用fitmodel
以适应模型。
sc = fitmodel (sc,“VariableSelection”,“fullmodel”,“显示”,“关闭”);
然后使用displaypoints
与creditscorecard
对象中使用的所有预测器变量的所有容器的点数表compactCreditScorecard
对象。通过设置displaypoints
'的名称-值对参数ShowCategoricalMembers”
来真正的
,则显示每个单独组中包含的所有成员。
[PointsInfo, MinScore MaxScore] = displaypoints (sc,“ShowCategoricalMembers”,真正的)
PointsInfo =51×3表预测本点 _______________ ______________ _______ {' BasePoints}{‘BasePoints} 535.25 {CustID的}{[无穷,121)的12.085}{CustID的}{5.4738”(121241)“}{CustID的}{[241、1081)的-1.4061}{CustID的}{”(1081年,正)}-7.2217 {CustID的}{“失踪> <”}12.085{‘CustAge}{[无穷,33)的-25.973}{‘CustAge}{'[33岁,37)}{-22.67“CustAge”} {'[37,40)' } -17.122 {'CustAge' } {'[40,46)' } -2.8071 {'CustAge' } {'[46,48)' } 9.5034 {'CustAge' } {'[48,51)' } 10.913 {'CustAge' } {'[51,58)' } 13.844 {'CustAge' } {'[58,Inf]' } 37.541 {'CustAge' } {'' } -9.7271 {'TmAtAddress'} {'[-Inf,23)' } -9.3683 ⋮
MinScore = 300.0000
MaxScore = 800
sc
- - - - - -信用计分卡模型creditscorecard
对象信用记分卡模型,指定为creditscorecard
对象。使用creditscorecard
创建一个creditscorecard
对象。
指定可选的逗号分隔的对名称,值
参数。的名字
参数名和价值
为对应值。的名字
必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家
.
[PointsInfo, MinScore MaxScore] = displaypoints (sc, ShowCategoricalMembers,真的)
“ShowCategoricalMembers”
- - - - - -用于显示分组在一起的类别的容器标签的指示符假
(默认)|真正的
或假
指示符,用于显示分组在一起的类别的容器标签,指定为由逗号分隔的对组成“ShowCategoricalMembers”
和一个值为的逻辑标量真正的
或假
.
默认情况下,当“ShowCategoricalMembers”
是假
, bin标签显示为Group1
,Group2
、……集团
n,或是否修改了容器标签creditscorecard
,则显示用户定义的bin标签名。
如果“ShowCategoricalMembers”
是真正的
,则显示每个单独组中包含的所有成员。
数据类型:逻辑
PointsInfo
-每个容器,每个预测器,与相应的点一行每个bin、每个预测器一行,带有相应的点,作为表返回。例如:
预测 | 箱子 | 点 |
---|---|---|
Predictor_1 | Bin_11 | Points_11 |
Predictor_1 | Bin_12 | Points_12 |
Predictor_1 | Bin_13 | Points_13 |
... | ... | |
Predictor_1 | “失踪> <” |
南 (默认) |
Predictor_2 | Bin_21 | Points_21 |
Predictor_2 | Bin_22 | Points_22 |
Predictor_2 | Bin_23 | Points_23 |
... | ... | |
Predictor_2 | “失踪> <” |
南 (默认) |
Predictor_j | Bin_j我 | Points_j我 |
... | ... | |
Predictor_j | “失踪> <” |
南 (默认) |
displaypoints
总是显示一个“失踪> <”
Bin为每个预测器。价值“失踪> <”
Bin来源于首字母creditscorecard
对象,“失踪> <”
Bin设置为南
当记分卡模型没有关于如何给缺失数据分配分数的信息时。
为。配置点“失踪> <”
Bin,必须使用首字母creditscorecard
对象。对于训练集中缺失值的预测器,则“失踪> <”
Bin是根据数据估计的“BinMissingData”
名称-值对参数设置为真正的
使用creditscorecard
.当“BinMissingData”
参数设置为假
,或当数据在训练集中不包含缺失值时,使用“失踪”
中的名称-值对参数formatpoints
指示如何为缺失的数据分配点。
当基点单独报告时(见formatpoints
),返回的第一行PointsInfo
表中包含基准点。
MinScore
最低可能的总分最小可能的总分,作为标量返回。
最低分数是数学意义上可能的最低总分,与低分数是否意味着高风险或低风险无关。
MaxScore
-最大可能的总分可能的最大总分,作为标量返回。
最高分数是数学意义上可能的最高总分,与高分是否意味着高风险或低风险无关。
预测点j和本我默认为
Points_ji = (Shift + Slope*b0)/p + Slope*(bj*WOEj(i))
转变
和坡
是比例常数。
当基线点单独报告时(见formatpoints
名称-值对的观点BasePoints
),基点为
基点=位移+斜率*b0,
Points_ji =坡* (bj * WOEj(我)))。
默认情况下,不单独报告基准点。
最低分和最高分分别为:
MinScore = Shift + Slope*b0 + min(Slope*b1*WOE1) +…+min(Slope*bp*WOEp)), MaxScore = Shift + Slope*b0 + max(Slope*b1*WOE1) +…+马克斯(斜率* bp * WOEp))。
使用formatpoints
控制点缩放、四舍五入的方式,以及是否单独报告基准点。看到formatpoints
有关格式参数的更多信息,以及有关这些格式选项的详细信息和公式。
[1]安德森,R。信用评分工具包。牛津大学出版社,2007。
[2] Refaat, M。信用风险记分卡:使用SAS开发和实施。lulu.com, 2011。
autobinning
|bindata
|bininfo
|creditscorecard
|fitmodel
|formatpoints
|modifybins
|modifypredictor
|plotbins
|predictorinfo
|probdefault
|分数
|setmodel
|validatemodel
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。