本主题将显示使用需要进行故障排除的信用记分卡时的一些结果。这些示例涵盖了信用记分卡工作流的全部范围。关于创建和开发信用记分卡的整个过程的详细信息,请参见信用记分卡建模工作流程。
如果你试图使用ModifierBins.
那bininfo
, 或者绘图赛
并省略预测器的名称,解析器返回错误。
加载CreditCardDatasc = creditscorecard(数据,'idvar'那'Custid'那'goodlabel', 0);ModififyBins(SC,'切口',[20 30 50 65])
使用creditscorecard/modifybins出错(第79行)参数名期望字符串,而不是输入类型是'double'。
解决方案:使用这些功能时,请务必包含预测器的名称。使用此语法指定predictorname.
使用时ModifierBins.
。
加载CreditCardDatasc = creditscorecard(数据,'idvar'那'Custid'那'goodlabel', 0);ModififyBins(SC,“缅因”那'切口',[20 30 50 65]);
bininfo
或者绘图赛
在分手之前如果你使用bininfo
或者绘图赛
在丢弃之前,结果可能无法使用。
加载CreditCardDatasc = creditscorecard(数据,'idvar'那'Custid'那'goodlabel', 0);Bininfo(SC,“守护”)Plotbins(SC,“守护”)
ans =本好不好悲哀InfoValue几率 ________ ____ ___ _______ _________ __________ ' 21 ' 2 1 2 -0.011271 - 3.1821 e-07 ' 22 ' 3 1 3 0.39419 - 0.00047977 23 ' 1 2 0.5 -1.3976 0.0053002 ' 24 ' 3 4 0.75 -0.9921 0.0062895 ' 25 ' 3 1 3 0.39419 - 0.00047977”26日的4 2 2 -0.011271 - 6.3641 e-07 27的6 5 1.2 -0.5221 0.0026744 28”10 2 5 0.90502 - 0.0067112“29”8 6 1.3333-0.41674 - 0.0021465“30”9 10 0.9 -0.80978 0.011321“31”8 6 1.3333 -0.41674 0.0021465“32”13 13 1 11 0.81818 -0.90509 0.014934 -0.70442 0.011663“33”9“34”14 12 1.1667 -0.55027 0.0070391“35”18 10 1.8 -0.11663 0.00032342“36”23日14 1.6429 -0.20798 0.0013772“37”28日19 1.4737 -0.31665 0.0041132“38”24日14 1.7143 -0.16542 0.0008894 1.5“39”21日14-0.29895 0.0027242 '40' 31 12 2.5833 0.24466 0.0020499 '41' 21 18 1.1667 -0.55027 0.010559 '42' 29 9 3.2222 0.46565 0.0062605 '43' 29 23 1.2609 -0.47262 0.010312 '44' 28 16 1.75 -0.1448 0.00078672 '45' 36 16 2.25 0.10651 0.00048246 '46' 33 19 1.7368 -0.15235 0.0010303 '47' 28 6 4.6667 0.83603 0.016516 '48' 32 17 1.8824 -0.071896 0.00021357 '49' 38 10 3.8 0.63058 0.013957 '50' 33 14 2.3571 0.15303 0.00089239 '51' 28 9 3.1111 0.43056 0.0052525 '52' 35 8 4.375 0.77149 0.01808 '53' 14 8 1.75 -0.1448 0.00039336 '54' 27 12 2.25 0.10651 0.00036184 '55' 20 9 2.2222 0.094089 0.00021044 '56' 20 11 1.8182 -0.10658 0.00029856 '57' 16 7 2.2857 0.12226 0.00028035 '58' 11 7 1.5714 -0.25243 0.00099297 '59' 11 6 1.8333 -0.098283 0.00013904 '60' 9 4 2.25 0.10651 0.00012061 '61' 11 2 5.5 1.0003 0.0086637 '62' 8 0 Inf Inf Inf '63' 7 1 7 1.2415 0.0076953 '64' 10 0 Inf Inf Inf '65' 4 1 4 0.68188 0.0016791 '66' 6 1 6 1.0873 0.0053857 '67' 2 3 0.66667 -1.1099 0.0056227 '68' 6 1 6 1.0873 0.0053857 '69' 6 0 Inf Inf Inf '70' 1 0 Inf Inf Inf '71' 1 0 Inf Inf Inf '72' 1 0 Inf Inf Inf '73' 3 0 Inf Inf Inf '74' 1 0 Inf Inf Inf 'Totals' 803 397 2.0227 NaN Inf
的情节保管
不可读取,因为它有太多的垃圾箱。还,bininfo
返回具有的数据正
由于零观察导致祸害的值好的或者坏的。
解决方案:使用数据autobinning.
或者ModifierBins.
在策划或询问宾统计数据之前,以避免垃圾箱或携带太多南
沙正
s。例如,您可以使用名称值对参数AlgoOptions
与autobinning.
函数来定义容器的数量。
加载CreditCardDatasc = creditscorecard(数据,'idvar'那'Custid'那'goodlabel', 0);AlgoOptions = {'numbins',4};sc = autobinning(sc,“守护”那“算法”那'平等频繁'那......'algorithmOptions',algoOptions);Bininfo(SC,“守护”那'总计'那“关闭”)Plotbins(SC,“守护”)
ans = bin好的赔率Woe infoveue ___________ _________________ __________'[-inf,39)'186 133 1.3985-0.36902 0.03985-0.195 108 1.8056 -0.11355 0.0033158'[46,52)'192 752.56 0.23559 0.011823'[52,INF]'230 81 2.8395 0.33921 0.02795
分类数据通常使用数值记录,并且可以存储在数字数组中。虽然您知道数据应该被解释为分类信息CreditsCorecard.
此预测仪看起来像数字数组。
为了显示类别数据作为数值数据给出的情况,变量的数据resstatus
故意转换为数值。
加载CreditCardDatadata.resstatus = double(data.resstatus);sc = creditscorecard(数据,'idvar'那'Custid')
sc = creditscorecard具有属性:goodlabel:0 responsevar:'status'varnames:{1x11 cell} numericpredictors:{1x7 cell}分类预防器:{'empstatus''odycc'} IDVAR:'CustId'预测orvars:{1x9 Cell}
注意'resstatus'
出现作为的一部分NumericPredictors
财产。如果我们应用了自动装箱,生成的装箱信息将引发与预测器类型有关的标志。
sc = autobinning(sc,'resstatus');[bi,cg] = bininfo(sc,'resstatus')
BI =宾好差赔率WOE INFOVALUE __________ ____ ___ ______ _________ __________ '[-Inf,2)' 365 177 2.0621 0.019329 0.0001682 '[2,TNF]' 438 220 1.9909 -0.015827 0.00013772 '总计' 803 397 2.0227的NaN 0.00030592 CG =2
垃圾箱标签中的数字范围显示'resstatus'
被视为数字变量。这也得到了可选的产出bininfo
是一个切割点数组,而不是一个包含类别分组的表。而且,输出来自predictorinfo.
确认信用记分卡将数据视为数字。
[t,stats] = predictorinfo(sc,'resstatus')
t =预测resultbinning _____________ ______________________ resstatus'numeric''自动/单调'统计=值_______ min 1 max 3平均1.7017 std 0.71863
解决方案: 为了CreditsCorecard.
那“分类”
意味着一个matlab.®分类数据类型。有关更多信息,请参阅分类
。治疗'resstatus'
作为分类,改变“PredictorType”
的predictorname.
'resstatus'
从'数字'
至“分类”
使用modifypredictor.
。
sc = modifypredictor(sc,'resstatus'那“PredictorType”那“分类”)[t,stats] = predictorinfo(sc,'resstatus')
sc = creditscorecard具有属性:goodlabel:0 responsevar:'status'varnames:{1x11 Cell} NumericPredictors:{1x6 Cell} CatericalPredictors:{'Resstatus''empstatus'''Ottuccc'} Idvar:'CustId'预测orvars:{1x9 Cell}T =预测序数级纯净________________________________________________ resstatus的分类'假'原始数据'统计=计数_____ c1 542 c2 474 c3 184
注意'resstatus'
现在显示为分类预测器的一部分。还,predictorinfo.
现在描述'resstatus'
作为分类并显示类别计数。
如果你申请autobinning.
,这些类别现在重新排序,如通过呼叫所示bininfo
,这也显示了类别标签,而不是数字范围。可选输出bininfo
现在是一个类别分组表。
sc = autobinning(sc,'resstatus');[bi,cg] = bininfo(sc,'resstatus')
BI =宾好差赔率WOE INFOVALUE ________ ____ ___ ______ _________ _________ 'C2' 307 167 1.8383 -0.095564 0.0036638 'C1' 365 177 2.0621 0.019329 0.0001682 'C3' 131 53 2.4717 0.20049 0.0059418 '总计' 803 397 2.0227的NaN 0.0097738 CG =类别Binnumber ________ __________'c2'1'C1'2'C3'3
南
为“测试”数据集评分时返回的当应用CreditsCorecard.
使用该模型到“测试”数据集分数
函数,如果“test”数据集中的观察结果具有南
或者<定义>
值,南
为每个观察结果返回总分。例如,一个CreditsCorecard.
使用“培训”数据创建对象。
加载CreditCardDatasc = creditscorecard(数据,'idvar'那'Custid');sc = autobinning(sc);sc = fitmodel(sc);
1.添加CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601添加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078添加OtherCC, Deviance = 1433.707, Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:logit(status) ~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance分布=二项估计系数:估计SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.06401 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16
假设缺少观察(南
)添加到数据中,然后newdata
使用该评分分数
功能。默认情况下,分配给缺失值的点和分数是南
。
newdata =数据(1:10,:);newdata.Custage(1)= Nan;[得分] =得分(SC,NewData)
分数= NaN的1.4646 0.7662 1.5779 1.4535 1.8944 -0.0872 0.9207 1.0399 0.8252积分= CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ________ _________ _________ __________ _________ ________ _________的NaN -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445 -0.031252 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 0.12696 0.31449 0.43693 0.15842 -0.044811 0.479 0.35551 0.12696 0.31449 0.43693 0.15842 -0.044811 0.479 -0.017472 0.12696 0.31449 0.43693 0.39607 0.15842 -0.017472 -0.14036 0.12696 -0.076317 -0.10466 -0.033752 0.15842 -0.017472 0.23039 0.37641 0.31449 0.43693 -0.033752 -0.19168 -0.21206 0.23039 -0.031252 -0.076317 0.43693 -076317 0.43693 -076317 0.43693 -076317752 0.15842 0.35551 0.23039 0.23039 0.12696 -0.076317 0.43693 -0.033752 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.12696 -0.07472
另外,请注意,因为保管
第一个观测的预测是南
, 相应的得分
产出是南
还。
解决方案:要解决此问题,请使用格式点
使用名称值对参数的函数失踪
。使用时失踪
,你可以替换预测的原因南
根据三个替代标准的价值('zerowoe'
那“MinPoints”
, 或者'maxpoints'
)。
例如,使用失踪
属性替换缺失的值“MinPoints”
选项。具有缺失数据的行现在具有对应于分配最小可能点的分数保管
。
sc = formatopoints(sc,'丢失的'那“MinPoints”);[分数,点] =得分(sc,newdata)pointstable = displaypoints(sc);pointStable(1:7,:)
分数= 0.7074 1.4646 0.7662 1.5779 1.4535 1.8944 -0.0872 0.9207 1.0399 0.8252积分= CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ________ _________ _________ __________ _________ ________ _________ -0.15894 -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445-0.031252 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 0.12696 0.31449 0.43693 -0.044811 0.15842 0.35551 0.479 0.12696 0.31449 0.43693 -0.044811 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 0.39607 0.15842 -0.017472 -0.14036 0.12696 -0.076317 -0.10466 -0.033752 0.15842 -0.017472 0.23039 0.37641 0.31449 0.43693-0.033752 -0.19168 -0.21206 0.23039 -0.031252 -0.076317 -0.033752 0.43693 0.15842 0.35551 0.23039 0.12696 -0.076317 0.43693 -0.033752 0.15842 -0.017472 ANS =预测因子滨点数__________ ___________ _________ 'CustAge' '[-Inf,33)' -0.15894 'CustAge''[33,37)'-0.14036'EURRAGE'''''''-0.060323'保管'[40,46)'0.046408'TERAGE'[46,48)'0.21445'守护者'[48,58)'0.23039'守护者'[58,INF]'0.479
请注意得分
输出具有第一个客户记录的值,因为保管
现在有一个值,可以为第一个客户记录计算分数。
autobinning.
|bindata.
|bininfo
|CreditsCorecard.
|displaypoints
|Fitmodel.
|格式点
|ModifierBins.
|modifypredictor.
|绘图赛
|predictorinfo.
|probdefault.
|分数
|setmodel.
|viewatemodel.