主要内容

plotbins

绘制直方图统计的预测变量

描述

例子

plotbins (sc,PredictorName)块直方图计算对于给定预测变量。当一个预测的箱子被修改modifybinsautobinning,重新运行plotbins更新图来反映这一变化。

例子

hFigure= plotbins (sc,PredictorName)返回一个句柄。plotbins块直方图计算对于给定预测变量。当一个预测的箱子被修改modifybinsautobinning,重新运行plotbins更新图来反映这一变化。

例子

hFigure= plotbins (___,名称,值)返回一个句柄。plotbins块直方图计算对于给定使用可选的名称-值对预测变量参数。当一个预测的箱子被修改modifybinsautobinning,重新运行plotbins更新图来反映这一变化。

例子

全部折叠

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。

负载CreditCardDatasc = creditscorecard(数据);

执行自动装箱PredictorName输入参数为CustIncome使用默认值的算法单调

sc = autobinning (sc,“CustIncome”)
sc = creditscorecard属性:GoodLabel: 0 ResponseVar:“地位”WeightsVar:“VarNames: {CustID的‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance UtilRate的“地位”}NumericPredictors: {CustID的‘CustAge’‘TmAtAddress’‘CustIncome’‘TmWBank’‘AMBalance’‘UtilRate} CategoricalPredictors: {“ResStatus”“EmpStatus”“OtherCC”} BinMissingData: 0 IDVar:“PredictorVars: {CustID的‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance’‘UtilRate}数据:[1200 x11表)

使用bininfo显示autobinned数据。

(bi, cp) = bininfo (sc,“CustIncome”)
bi =8×6表本好与坏的几率,悲哀InfoValue _________________出生_____ _____{[无穷,29000)的}53 58 0.91379 -0.79457 0.06364{[29000、33000)}74年49 1.5102 -0.29217 0.0091366{[33000、35000)的36}68 1.8889 -0.06843 0.00041042{[35000、40000)的}193 98 1.9694 -0.026696 0.00017359{[40000、42000)的}68 34 2 -0.011271 - 1.0819 e-05{[42000、47000)的}164 66 2.4848 0.20579 0.0078175{”(47000年,正)}183年56 3.2679 0.47972 0.041657{“总数”}803 397 0.12285 2.0227南
cp =6×129000 33000 35000 40000 42000 47000

手动删除第二个减少点(第二和第三箱之间的界限)合并箱2和3。使用modifybins函数来更新计分卡然后显示更新本信息。

cp (2) = [];sc = modifybins (sc,“CustIncome”,“割点”,cp);bi = bininfo (sc,“CustIncome”)
bi =7×6表本好与坏的几率,悲哀InfoValue _________________出生_____ _____{[无穷,29000)的}53 58 0.91379 -0.79457 0.06364{[29000、35000)的}142 85 1.6706 -0.19124 0.0071274{[35000、40000)的}193 98 1.9694 -0.026696 0.00017359{[40000、42000)的}68 34 2 -0.011271 - 1.0819 e-05{[42000、47000)的}164 66 2.4848 0.20579 0.0078175{”(47000年,正)}183年56 3.2679 0.47972 0.041657{“总数”}803 397 0.12043 2.0227南

图的直方图统计更新本信息PredictorName被称为CustIncome

plotbins (sc,“CustIncome”)

图包含一个坐标轴对象。坐标轴对象标题CustIncome ylabel悲哀包含3对象类型的酒吧,线。这些对象是好的,坏的。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据(使用一个数据集从Refaat 2011)。

负载CreditCardDatasc = creditscorecard(数据);

执行自动装箱PredictorName输入参数为CustIncome使用默认值的算法单调

sc = autobinning (sc,“CustIncome”)
sc = creditscorecard属性:GoodLabel: 0 ResponseVar:“地位”WeightsVar:“VarNames: {CustID的‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance UtilRate的“地位”}NumericPredictors: {CustID的‘CustAge’‘TmAtAddress’‘CustIncome’‘TmWBank’‘AMBalance’‘UtilRate} CategoricalPredictors: {“ResStatus”“EmpStatus”“OtherCC”} BinMissingData: 0 IDVar:“PredictorVars: {CustID的‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance’‘UtilRate}数据:[1200 x11表)

使用bininfo显示autobinned数据。

(bi, cp) = bininfo (sc,“CustIncome”)
bi =8×6表本好与坏的几率,悲哀InfoValue _________________出生_____ _____{[无穷,29000)的}53 58 0.91379 -0.79457 0.06364{[29000、33000)}74年49 1.5102 -0.29217 0.0091366{[33000、35000)的36}68 1.8889 -0.06843 0.00041042{[35000、40000)的}193 98 1.9694 -0.026696 0.00017359{[40000、42000)的}68 34 2 -0.011271 - 1.0819 e-05{[42000、47000)的}164 66 2.4848 0.20579 0.0078175{”(47000年,正)}183年56 3.2679 0.47972 0.041657{“总数”}803 397 0.12285 2.0227南
cp =6×129000 33000 35000 40000 42000 47000

画出本信息CustIncome没有重量的证据(悲哀),没有一个传奇通过设置“悲哀”“传奇”名称-值参数“关闭”。同时,设置“BinText”名称-值对参数“PercentRows”显示为文本的情节酒吧为“好”和“坏”的比例在每个垃圾桶,也就是说,“好”和“坏”的概率在每个垃圾箱。

plotbins (sc,“CustIncome”,“悲哀”,“关闭”,“传奇”,“关闭”,“BinText”,“PercentRows”)

图包含一个坐标轴对象。坐标轴对象与标题CustIncome包含9对象类型的酒吧,文本。

创建一个creditscorecard对象使用CreditCardData.mat文件加载数据用缺失值。

负载CreditCardData.mat头(dataMissing, 5)
CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate ____ ____地位………………_____ _____ _____ ________ ________ 53 62 <定义>未知50000 55是的1055.9 - 0.22 0 2 61 22业主雇佣52000 25是的1161.6 - 0.24 0 3 47 30租户使用37000 61没有877.23 - 0.29 0 4南75业主雇佣了53000 20是的157.37 - 0.08 0 5 68 56家老板雇用了53000名14是的561.84 - 0.11 0
流(“行数:% d \ n”、高度(dataMissing))
的行数:1200
流(“CustAge缺失值的数量:% d \ n '总和(ismissing (dataMissing.CustAge)))
CustAge缺失值的数量:30
流(“ResStatus缺失值的数量:% d \ n '总和(ismissing (dataMissing.ResStatus)))
ResStatus缺失值的数量:40

使用creditscorecard名称-值的参数“BinMissingData”设置为真正的本失踪的数字或分类数据在一个单独的垃圾箱。

sc = creditscorecard (dataMissing,“IDVar”,“CustID”,“BinMissingData”,真正的);sc = autobinning (sc);disp (sc)
creditscorecard属性:GoodLabel: 0 ResponseVar:“地位”WeightsVar:“VarNames: {CustID的‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance UtilRate的“地位”}NumericPredictors: {‘CustAge’‘TmAtAddress’‘CustIncome’‘TmWBank’‘AMBalance’‘UtilRate} CategoricalPredictors: {“ResStatus”“EmpStatus”“OtherCC”} BinMissingData: 1 IDVar:“CustID”PredictorVars: {‘CustAge’‘TmAtAddress’‘ResStatus’‘EmpStatus’‘CustIncome’‘TmWBank’‘OtherCC’‘AMBalance’‘UtilRate}数据:[1200 x11表)

数字数据的显示和绘制本信息“CustAge”包括缺失的数据在一个单独的本标签<失踪>

(bi, cp) = bininfo (sc,“CustAge”);disp (bi)
本好与坏的几率,悲哀InfoValue _________________出生______月______ __________{[无穷,33)}69年52 1.3269 -0.42156 0.018993{[33岁,37)}63年45 1.4 -0.36795 0.012839{[37、40)}72年47 1.5319 -0.2779 0.0079824{'[40岁,46)}172 89 1.9326 -0.04556 0.0004549{'[46岁,48)}59 25 2.36 0.15424 0.0016199{[48,51)}99年41 2.4146 0.17713 0.0035449{'[51岁,58)}157 62 2.5323 0.22469 0.0088407{的[58岁的Inf]} 93年25 3.72 0.60931 0.032198{' <失踪>}19 11 1.7273 -0.15787 0.00063885{“总数”}803 397 0.087112 2.0227南
plotbins (sc,“CustAge”)

图包含一个坐标轴对象。坐标轴对象标题CustAge ylabel悲哀包含3对象类型的酒吧,线。这些对象是好的,坏的。

本信息为分类数据显示和阴谋“ResStatus”包括缺失的数据在一个单独的本标签<失踪>

(bi, cg) = bininfo (sc,“ResStatus”);disp (bi)
本好与坏的几率,悲哀出生______ _____ __________ InfoValue * * *{“租户”}296 161 1.8385 -0.095463 0.0035249{‘业主’}352 171 2.0585 0.017549 0.00013382{‘其他’}128年52 2.4615 0.19637 0.0055808{' <失踪>}27 13 2.0769 0.026469 2.3248 e-05{“总数”}803 397 0.0092627 2.0227南
plotbins (sc,“ResStatus”)

图包含一个坐标轴对象。坐标轴对象标题ResStatus ylabel悲哀包含3对象类型的酒吧,线。这些对象是好的,坏的。

输入参数

全部折叠

信用计分卡模型,指定为一个creditscorecard对象。使用creditscorecard创建一个creditscorecard对象。

指定的一个或多个预测情节,名称使用特征向量或单元阵列特征向量包含一个或多个预测的名字。

数据类型:字符|细胞

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:plotbins (sc, PredictorName BinText”,“数”,“悲哀”,“上”)

信息显示绘制本数量,指定为逗号分隔组成的“BinText”和一个特征向量的值:

  • 没有一个——没有文本显示在箱子的顶部。

  • ——对于每一个本,显示计数为“好”和“坏”。

  • PercentRows——对于每一个本,显示计数为“好”和“坏”的观测数的比例。

  • PercentCols——对于每一个本,显示计数为“好”和“坏”的比例的总“好”和“坏”在整个样本。

  • PercentTotal——对于每一个本,显示计数为“好”和“坏”的总数的比例在整个样本观察。

数据类型:字符

指标权重的证据(悲哀),指定为逗号分隔组成的“悲哀”和值特征向量。当设置为,悲哀线绘制的直方图。

数据类型:字符

指标的传奇情节,指定为逗号分隔组成的“传奇”和值特征向量

数据类型:字符

输出参数

全部折叠

图处理对直方图的情节为预测变量,返回如图图对象的对象或数组如果不止一个PredictorName被指定为一个输入。

引用

[1]安德森,R。信用评分工具包。牛津大学出版社,2007年。

[2]Refaat, M。信用风险记分卡:使用情景应用程序开发和实现。lulu.com, 2011。

版本历史

介绍了R2014b