信用记分卡结果故障排除

本主题将显示使用需要进行故障排除的信用记分卡时的一些结果。这些示例涵盖了信用记分卡工作流的全部范围。关于创建和开发信用记分卡的整个过程的详细信息,请参见信用记分卡建模工作流程

预测名称未指定,解析器返回错误

如果你试图使用ModifierBins.bininfo, 或者绘图赛并省略预测器的名称,解析器返回错误。

加载CreditCardDatasc = creditscorecard(数据,'idvar''Custid''goodlabel', 0);ModififyBins(SC,'切口',[20 30 50 65])
使用creditscorecard/modifybins出错(第79行)参数名期望字符串,而不是输入类型是'double'。

解决方案:使用这些功能时,请务必包含预测器的名称。使用此语法指定predictorname.使用时ModifierBins.

加载CreditCardDatasc = creditscorecard(数据,'idvar''Custid''goodlabel', 0);ModififyBins(SC,“缅因”'切口',[20 30 50 65]);

使用bininfo或者绘图赛在分手之前

如果你使用bininfo或者绘图赛在丢弃之前,结果可能无法使用。

加载CreditCardDatasc = creditscorecard(数据,'idvar''Custid''goodlabel', 0);Bininfo(SC,“守护”)Plotbins(SC,“守护”
ans =本好不好悲哀InfoValue几率  ________ ____ ___ _______ _________ __________ ' 21 ' 2 1 2 -0.011271 - 3.1821 e-07 ' 22 ' 3 1 3 0.39419 - 0.00047977 23 ' 1 2 0.5 -1.3976 0.0053002 ' 24 ' 3 4 0.75 -0.9921 0.0062895 ' 25 ' 3 1 3 0.39419 - 0.00047977”26日的4 2 2 -0.011271 - 6.3641 e-07 27的6 5 1.2 -0.5221 0.0026744 28”10 2 5 0.90502 - 0.0067112“29”8 6 1.3333-0.41674 - 0.0021465“30”9 10 0.9 -0.80978 0.011321“31”8 6 1.3333 -0.41674 0.0021465“32”13 13 1 11 0.81818 -0.90509 0.014934 -0.70442 0.011663“33”9“34”14 12 1.1667 -0.55027 0.0070391“35”18 10 1.8 -0.11663 0.00032342“36”23日14 1.6429 -0.20798 0.0013772“37”28日19 1.4737 -0.31665 0.0041132“38”24日14 1.7143 -0.16542 0.0008894 1.5“39”21日14-0.29895 0.0027242 '40' 31 12 2.5833 0.24466 0.0020499 '41' 21 18 1.1667 -0.55027 0.010559 '42' 29 9 3.2222 0.46565 0.0062605 '43' 29 23 1.2609 -0.47262 0.010312 '44' 28 16 1.75 -0.1448 0.00078672 '45' 36 16 2.25 0.10651 0.00048246 '46' 33 19 1.7368 -0.15235 0.0010303 '47' 28 6 4.6667 0.83603 0.016516 '48' 32 17 1.8824 -0.071896 0.00021357 '49' 38 10 3.8 0.63058 0.013957 '50' 33 14 2.3571 0.15303 0.00089239 '51' 28 9 3.1111 0.43056 0.0052525 '52' 35 8 4.375 0.77149 0.01808 '53' 14 8 1.75 -0.1448 0.00039336 '54' 27 12 2.25 0.10651 0.00036184 '55' 20 9 2.2222 0.094089 0.00021044 '56' 20 11 1.8182 -0.10658 0.00029856 '57' 16 7 2.2857 0.12226 0.00028035 '58' 11 7 1.5714 -0.25243 0.00099297 '59' 11 6 1.8333 -0.098283 0.00013904 '60' 9 4 2.25 0.10651 0.00012061 '61' 11 2 5.5 1.0003 0.0086637 '62' 8 0 Inf Inf Inf '63' 7 1 7 1.2415 0.0076953 '64' 10 0 Inf Inf Inf '65' 4 1 4 0.68188 0.0016791 '66' 6 1 6 1.0873 0.0053857 '67' 2 3 0.66667 -1.1099 0.0056227 '68' 6 1 6 1.0873 0.0053857 '69' 6 0 Inf Inf Inf '70' 1 0 Inf Inf Inf '71' 1 0 Inf Inf Inf '72' 1 0 Inf Inf Inf '73' 3 0 Inf Inf Inf '74' 1 0 Inf Inf Inf 'Totals' 803 397 2.0227 NaN Inf

的情节保管不可读取,因为它有太多的垃圾箱。还,bininfo返回具有的数据由于零观察导致祸害的值好的或者坏的

解决方案:使用数据autobinning.或者ModifierBins.在策划或询问宾统计数据之前,以避免垃圾箱或携带太多s。例如,您可以使用名称值对参数AlgoOptionsautobinning.函数来定义容器的数量。

加载CreditCardDatasc = creditscorecard(数据,'idvar''Custid''goodlabel', 0);AlgoOptions = {'numbins',4};sc = autobinning(sc,“守护”“算法”'平等频繁'......'algorithmOptions',algoOptions);Bininfo(SC,“守护”'总计'“关闭”)Plotbins(SC,“守护”
ans = bin好的赔率Woe infoveue ___________ _________________ __________'[-inf,39)'186 133 1.3985-0.36902 0.03985-0.195 108 1.8056 -0.11355 0.0033158'[46,52)'192 752.56 0.23559 0.011823'[52,INF]'230 81 2.8395 0.33921 0.02795

如果将分类数据作为数字给出

分类数据通常使用数值记录,并且可以存储在数字数组中。虽然您知道数据应该被解释为分类信息CreditsCorecard.此预测仪看起来像数字数组。

为了显示类别数据作为数值数据给出的情况,变量的数据resstatus故意转换为数值。

加载CreditCardDatadata.resstatus = double(data.resstatus);sc = creditscorecard(数据,'idvar''Custid'
sc = creditscorecard具有属性:goodlabel:0 responsevar:'status'varnames:{1x11 cell} numericpredictors:{1x7 cell}分类预防器:{'empstatus''odycc'} IDVAR:'CustId'预测orvars:{1x9 Cell}

注意'resstatus'出现作为的一部分NumericPredictors财产。如果我们应用了自动装箱,生成的装箱信息将引发与预测器类型有关的标志。

sc = autobinning(sc,'resstatus');[bi,cg] = bininfo(sc,'resstatus'
BI =宾好差赔率WOE INFOVALUE __________ ____ ___ ______ _________ __________ '[-Inf,2)' 365 177 2.0621 0.019329 0.0001682 '[2,TNF]' 438 220 1.9909 -0.015827 0.00013772 '总计' 803 397 2.0227的NaN 0.00030592 CG =2

垃圾箱标签中的数字范围显示'resstatus'被视为数字变量。这也得到了可选的产出bininfo是一个切割点数组,而不是一个包含类别分组的表。而且,输出来自predictorinfo.确认信用记分卡将数据视为数字。

[t,stats] = predictorinfo(sc,'resstatus'
t =预测resultbinning _____________ ______________________ resstatus'numeric''自动/单调'统计=值_______ min 1 max 3平均1.7017 std 0.71863

解决方案: 为了CreditsCorecard.“分类”意味着一个matlab.®分类数据类型。有关更多信息,请参阅分类。治疗'resstatus'作为分类,改变“PredictorType”predictorname.'resstatus''数字'“分类”使用modifypredictor.

sc = modifypredictor(sc,'resstatus'“PredictorType”“分类”)[t,stats] = predictorinfo(sc,'resstatus'
sc = creditscorecard具有属性:goodlabel:0 responsevar:'status'varnames:{1x11 Cell} NumericPredictors:{1x6 Cell} CatericalPredictors:{'Resstatus''empstatus'''Ottuccc'} Idvar:'CustId'预测orvars:{1x9 Cell}T =预测序数级纯净________________________________________________ resstatus的分类'假'原始数据'统计=计数_____ c1 542 c2 474 c3 184

注意'resstatus'现在显示为分类预测器的一部分。还,predictorinfo.现在描述'resstatus'作为分类并显示类别计数。

如果你申请autobinning.,这些类别现在重新排序,如通过呼叫所示bininfo,这也显示了类别标签,而不是数字范围。可选输出bininfo现在是一个类别分组表。

sc = autobinning(sc,'resstatus');[bi,cg] = bininfo(sc,'resstatus'
BI =宾好差赔率WOE INFOVALUE ________ ____ ___ ______ _________ _________ 'C2' 307 167 1.8383 -0.095564 0.0036638 'C1' 365 177 2.0621 0.019329 0.0001682 'C3' 131 53 2.4717 0.20049 0.0059418 '总计' 803 397 2.0227的NaN 0.0097738 CG =类别Binnumber ________ __________'c2'1'C1'2'C3'3

为“测试”数据集评分时返回的

当应用CreditsCorecard.使用该模型到“测试”数据集分数函数,如果“test”数据集中的观察结果具有或者<定义>值,为每个观察结果返回总分。例如,一个CreditsCorecard.使用“培训”数据创建对象。

加载CreditCardDatasc = creditscorecard(数据,'idvar''Custid');sc = autobinning(sc);sc = fitmodel(sc);
1.添加CustIncome, Deviance = 1490.8527, Chi2Stat = 32.588614, PValue = 1.1387992e-08添加TmWBank, Deviance = 1467.1415, Chi2Stat = 23.711203, PValue = 1.1192909e-06添加AMBalance, Deviance = 1455.5715, Chi2Stat = 11.569967, PValue = 0.00067025601添加EmpStatus, Deviance = 1447.3451, Chi2Stat = 8.2264038, PValue = 0.0041285257添加CustAge, Deviance = 1441.994, Chi2Stat = 5.3511754, PValue = 0.020708306添加ResStatus, Deviance = 1437.8756, Chi2Stat = 4.118404, PValue = 0.042419078添加OtherCC, Deviance = 1433.707, Chi2Stat = 4.1686018, PValue = 0.041179769广义线性回归模型:logit(status) ~ 1 + CustAge + ResStatus + EmpStatus + CustIncome + TmWBank + OtherCC + AMBalance分布=二项估计系数:估计SE tStat pValue ________ ________ ______ __________ (Intercept) 0.70239 0.06401 10.975 5.0538e-28 CustAge 0.60833 0.24932 2.44 0.014687 ResStatus 1.377 0.65272 2.1097 0.034888 EmpStatus 0.88565 0.293 3.0227 0.0025055 CustIncome 0.70164 0.21844 3.2121 0.0013179 TmWBank 1.1074 0.23271 4.7589 1.9464e-06 OtherCC 1.0883 0.52912 2.0569 0.039696AMBalance 1.045 0.32214 3.2439 0.0011792 1200 observations, 1192 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 89.7, p-value = 1.4e-16

假设缺少观察()添加到数据中,然后newdata使用该评分分数功能。默认情况下,分配给缺失值的点和分数是

newdata =数据(1:10,:);newdata.Custage(1)= Nan;[得分] =得分(SC,NewData)
分数= NaN的1.4646 0.7662 1.5779 1.4535 1.8944 -0.0872 0.9207 1.0399 0.8252积分= CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ________ _________ _________ __________ _________ ________ _________的NaN -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445  -0.031252 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 0.12696 0.31449 0.43693 0.15842 -0.044811 0.479 0.35551 0.12696 0.31449 0.43693 0.15842 -0.044811 0.479 -0.017472 0.12696 0.31449 0.43693 0.39607 0.15842 -0.017472 -0.14036 0.12696 -0.076317 -0.10466 -0.033752 0.15842 -0.017472 0.23039 0.37641 0.31449 0.43693  -0.033752 -0.19168 -0.21206 0.23039 -0.031252 -0.076317 0.43693 -076317 0.43693 -076317 0.43693 -076317752 0.15842 0.35551 0.23039 0.23039 0.12696 -0.076317 0.43693 -0.033752 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.15842 0.12696 -0.07472

另外,请注意,因为保管第一个观测的预测是, 相应的得分产出是还。

解决方案:要解决此问题,请使用格式点使用名称值对参数的函数失踪。使用时失踪,你可以替换预测的原因根据三个替代标准的价值('zerowoe'“MinPoints”, 或者'maxpoints')。

例如,使用失踪属性替换缺失的值“MinPoints”选项。具有缺失数据的行现在具有对应于分配最小可能点的分数保管

sc = formatopoints(sc,'丢失的'“MinPoints”);[分数,点] =得分(sc,newdata)pointstable = displaypoints(sc);pointStable(1:7,:)
分数= 0.7074 1.4646 0.7662 1.5779 1.4535 1.8944 -0.0872 0.9207 1.0399 0.8252积分= CustAge ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance ________ _________ _________ __________ _________ ________ _________ -0.15894 -0.031252 -0.076317 0.43693 0.39607 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 -0.033752 0.15842 -0.017472 0.21445-0.031252 0.31449 0.081611 0.39607 -0.19168 -0.017472 0.23039 0.12696 0.31449 0.43693 -0.044811 0.15842 0.35551 0.479 0.12696 0.31449 0.43693 -0.044811 0.15842 -0.017472 0.479 0.12696 0.31449 0.43693 0.39607 0.15842 -0.017472 -0.14036 0.12696 -0.076317 -0.10466 -0.033752 0.15842 -0.017472 0.23039 0.37641 0.31449 0.43693-0.033752 -0.19168 -0.21206 0.23039 -0.031252 -0.076317 -0.033752 0.43693 0.15842 0.35551 0.23039 0.12696 -0.076317 0.43693 -0.033752 0.15842 -0.017472 ANS =预测因子滨点数__________ ___________ _________ 'CustAge' '[-Inf,33)' -0.15894 'CustAge''[33,37)'-0.14036'EURRAGE'''''''-0.060323'保管'[40,46)'0.046408'TERAGE'[46,48)'0.21445'守护者'[48,58)'0.23039'守护者'[58,INF]'0.479

请注意得分输出具有第一个客户记录的值,因为保管现在有一个值,可以为第一个客户记录计算分数。

也可以看看

||||||||||||||

相关例子

更多关于