主要内容

信用记分卡

创造信用记分卡对象构建信用记分卡模型

描述

创建一个信用记分卡模型信用记分卡对象,并以表格格式指定输入数据。

在创建信用记分卡对象,您可以使用相关的对象函数来存放数据并执行逻辑回归分析,以开发一个信用记分卡模型来指导信用决策。这个工作流展示了如何开发一个信用记分卡模型。

  1. 使用屏幕预测器(风险管理工具箱)从风险管理工具箱™中将潜在的大量预测因素缩减为最能预测信用评分卡响应变量的子集。在创建信用记分卡对象。

  2. 创建一个信用记分卡对象(请参见创建信用记分卡属性).

  3. 使用autobinning

  4. 使用以下公式拟合逻辑回归模型:fitmodelfitConstrainedModel

  5. 检查和格式化信用记分卡点数使用显示点格式点。此时,在工作流中,如果您拥有“风险管理工具箱”许可证,则可以选择创建信用记分卡对象(csc)使用契约然后,您可以使用以下函数显示点(风险管理工具箱),分数(风险管理工具箱)probdefault(风险管理工具箱)风险管理工具箱中的csc对象。

  6. 使用分数

  7. 使用以下公式计算数据的默认概率:probdefault

  8. 使用验证信用记分卡模型的质量验证模型

有关此工作流的详细信息,请参阅信用记分卡建模工作流

创建

描述

实例

sc=信用记分卡(数据)创建一个信用记分卡通过指定数据. 信用记分卡模型,返回为信用记分卡对象,包含一个或多个预测器的分类映射或规则(切点或类别分组)。

实例

sc=信用记分卡(___,名称、值)设置属性使用前面语法中的名称-值对和任何参数。例如,sc=信用记分卡(数据,'GoodLabel',0,'IDVar','ResponseVar','status','PredictVars',{'CustAge','CustIncome','WeightsVar','RowWeights','BinMissingData',true)。您可以指定多个名称-值对。

笔记

在创建信用卡时,在信用记分卡工作流中使用观察(样本)权重信用记分卡对象,则必须使用可选的名称-值对权重定义数据包含权重。

输入参数

全部展开

数据信用记分卡对象,指定为MATLAB®表,其中每列数据可以是以下任意一种数据类型:

  • 数字的

  • 必然的

  • 字符向量单元数组

  • 字符数组

  • 明确的

  • 一串

此外,该表必须包含一个二进制响应变量。在创建一个信用记分卡对象,执行数据准备任务以具有适当的结构数据作为输入到信用记分卡对象这个数据输入设置数据所有物

数据类型:桌子

名称-值对参数

指定可选的逗号分隔的字符对名称、值论据。的名字是参数名和价值是对应的值。的名字必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:名称1,值1,…,名称,值

例子:sc = creditscorecard(数据,“GoodLabel”,0,‘IDVar’,‘CustAge’,‘ResponseVar’,‘身份’,‘PredictorVars’,{‘CustID’,‘CustIncome},‘WeightsVar’,‘RowWeights’,‘BinMissingData’,真的)

响应变量中两个可能值中的哪一个对应于“良好”观察值的指示器,指定为逗号分隔对,包括“GoodLabel”和数字标量、逻辑或字符向量好标签名称-值对参数设置好标签所有物

当指定好标签,请遵循以下指导方针。

如果响应变量为。。。 好标签必须……
数字的 数字的
必然的 逻辑的还是数字的
字符向量的单元格数组 特征向量
字符数组 特征向量
明确的 特征向量

如果没有规定,好标签设置为具有最高计数的响应值。但是,如果权重参数在创建时提供信用记分卡对象,则计数将替换为加权频率。有关更多信息,请参阅基于观察权重的信用记分卡建模

好标签只能在创建信用记分卡对象。无法使用点表示法设置此参数。

数据类型:烧焦|双重的

用作观察的ID或标记的变量名,指定为逗号分隔对,由“IDVar”一个字符向量。这个IDVar数据可以是序号(例如,1,2,3…),也可以是社会保险号。这是为了方便从预测变量中删除此列。IDVar是区分大小写的IDVar名称-值对参数设置IDVar所有物

您可以使用信用记分卡函数或在命令行中使用点表示法,如下所示。

例子:sc.IDVar = ' CustID '

数据类型:烧焦

“Good”或“Bad”指示符的响应变量名称,指定为逗号分隔对,由“响应者”和一个字符向量。响应变量数据必须是二进制的。这个ResponseVar名称-值对参数设置ResponseVar所有物

如果没有规定,ResponseVar设置为数据输入的最后一列。ResponseVar只能在创建信用记分卡使用信用记分卡作用ResponseVar是区分大小写的。

数据类型:烧焦

权重变量名称,指定为逗号分隔对,由“WeightsVar”和一个字符向量,以指示数据表包含行权重。权重是区分大小写的权重名称-值对参数设置权重属性,且此属性只能在创建信用记分卡对象如果名称-值对参数权重创建时未指定信用记分卡对象,则默认情况下观察权重设置为单位权重。

这个权重值在信用记分卡工作流中由autobinning,bininfo,fitmodel验证模型。有关详细信息,请参阅基于观察权重的信用记分卡建模

数据类型:烧焦

指示丢失的数据是否已删除或显示在单独的存储箱中,指定为逗号分隔对,由“BinMissingdata”和值为的逻辑标量符合事实的错误的.如果BinMissingData符合事实的,预测器的缺失数据显示在单独的标有

数据类型:必然的

属性

全部展开

用于创建信用记分卡对象,在创建信用记分卡对象。在数据属性,分类预测值存储为分类数组。

例子:sc.数据(1:10,:)

数据类型:桌子

用作观察的ID或标记的变量的名称,指定为字符向量。在创建属性时,可以将此属性设置为可选参数信用记分卡对象或在命令行使用点表示法。IDVar是区分大小写的。

例子:sc.IDVar = ' CustID '

数据类型:烧焦

此属性是只读的。

VarNames是包含数据中所有变量名称的字符向量的单元格数组VarNames直接从数据输入到信用记分卡对象。VarNames是区分大小写的。

数据类型:单间牢房

响应变量的名称,“Good”或“Bad”指示器,指定为字符向量。响应变量数据必须是二进制的。如果没有规定,ResponseVar设置为数据输入的最后一列。创建属性时,只能使用可选参数设置此属性信用记分卡对象。ResponseVar是区分大小写的。

数据类型:烧焦

用作ID或标记的变量的名称,用于指示数据表包含指定为字符向量的行权重。此属性可以设置为可选参数(权重)在创建信用记分卡对象。权重是区分大小写的。

数据类型:烧焦

响应变量中哪两个可能值对应于“良好”观察值的指示器。指定时好标签,请遵循以下指导方针:

如果响应变量为。。。 好标签必须是:
数字的 数字的
必然的 逻辑的还是数字的
字符向量的单元格数组 特征向量
字符数组 特征向量
明确的 特征向量

如果没有规定,好标签设置为具有最高计数的响应值。在创建信用记分卡对象。不能使用点表示法设置此属性。

数据类型:烧焦|双重的

预测器变量名称,使用包含名称的字符向量的单元格数组指定。默认情况下,当您创建信用记分卡对象中,所有变量都是预测器,除了IDVarResponseVar。可以使用的名称-值对参数修改此属性fitmodel函数或使用点表示法。预测变量是否区分大小写,且预测器变量名不能与IDVarResponseVar

例子:sc.PredictorVars ={‘CustID’,‘CustIncome}

数据类型:单间牢房

数字预测器的名称,指定为字符向量。不能在命令行中使用点表示法设置此属性。只能使用修正预测器作用

数据类型:烧焦

类别预测器的名称,指定为字符向量。不能在命令行使用点表示法设置此属性。只能使用修正预测器作用

数据类型:烧焦

指示丢失的数据是否已删除或显示在单独的存储箱中,指定为逗号分隔对,由“BinMissingdata”和值为的逻辑标量符合事实的错误的.如果BinMissingData符合事实的,预测器的缺失数据显示在单独的标有. 有关处理缺失数据的详细信息,请参见缺少值的信用记分卡建模

数据类型:必然的

信用记分卡所有物 从命令行使用中设置/修改属性信用记分卡作用 使用点表示法修改属性 属性不是用户定义的,值是内部定义的
数据 是的,复印件数据输入
IDVar 是的 是的 否,但用户指定了此选项
VarNames 是的
ResponseVar 是的 如果未指定,则设置为的最后一列数据输入
权重 是的
好标签 是的 如果未指定,则设置为具有最高计数的响应值
预测变量 是的(也可以修改使用fitmodel功能) 是的 是的,但是用户可以修改它
数值预报器 没有(只能修改使用修正预测器功能) 是的,但是用户可以修改它
分类预测因子 没有(只能修改使用修正预测器功能) 是的,但是用户可以修改它
BinMissingData 是的 默认情况下为False,但用户可以修改此选项

目标函数

autobinning 执行给定预测器的自动装箱
bininfo 返回预测器的bin信息
predictorinfo 信用记分卡预测属性摘要
修正预测器 设置信用记分卡预测器的属性
fillmissing 替换信用记分卡预测器的缺失值
改装箱 修改预测器的箱子
宾达 组合预测变量
绘图仪 绘制直方图计数预测变量
fitmodel 将logistic回归模型与证据权重(WOE)数据拟合
fitConstrainedModel 根据模型系数的约束条件,将逻辑回归模型与证据权重(WOE)数据拟合
模型 设置模型预测因子和系数
显示点 每个料仓每个预测器的返回点
格式点 设置记分卡点数和比例
分数 计算给定数据的信用分数
probdefault 给定数据集的默认可能性
验证模型 验证信用记分卡模型的质量
契约 创建紧凑的信用记分卡

例子

全部崩溃

创建一个信用记分卡使用CreditCardData.mat要加载的文件数据(使用2011年Refaat的数据集)。

负载信用卡数据sc=信用记分卡(数据)
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x7 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'Predictor Vars:{1x10 cell}数据:[1200x11表格]

使用CreditCardData.mat载入数据的文件(数据权重),其中包含列(RowWeights)权重(使用2011年Refaat的数据集)。

负载信用卡数据

创建一个信用记分卡对象的可选名称-值对参数“WeightsVar”

sc=信用记分卡(数据权重,“WeightsVar”,“划船重量”)
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'RowWeights'变量名:{1x12 cell}数值预测值:{1x7 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'PredictorVars:{1x10 cell}数据:[1200x12表格]

创建一个信用记分卡使用CreditCardData.mat要加载的文件数据(使用2011年Refaat的数据集)。

负载信用卡数据sc=信用记分卡(数据)
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x7 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'Predictor Vars:{1x10 cell}数据:[1200x11表格]

显示信用记分卡对象属性,使用点表示法。

sc.预测变量
ans=1x10电池第1列至第4列{'CustID'}{'CustAge'}{'TmAtAddress'}{'ResStatus'}第5列至第8列{'EmpStatus'}{'custinenue'}{'TmWBank'}{'OtherCC'}第9列至第10列{'AMBalance'}{'UtilRate'}
sc.VarNames
ans=1x11电池第1列至第4列{'CustID'}{'CustAge'}{'TmAtAddress'}{'ResStatus'}第5列至第8列{'EmpStatus'}{'custinenue'}{'TmWBank'}{'OtherCC'}第9列至第11列{'AMBalance'}{'UtilRate'}{'status'}

创建一个信用记分卡使用CreditCardData.mat要加载的文件数据(使用2011年Refaat的数据集)。

负载信用卡数据sc=信用记分卡(数据)
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x7 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'Predictor Vars:{1x10 cell}数据:[1200x11表格]

自从IDVar属性具有公共访问权限,可以在命令行中更改其值。

sc.IDVar=“卡斯蒂德”
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x6 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'CustID'预测值:{1x9 cell}数据:[1200x11表格]

创建一个信用记分卡使用CreditCardData.mat要加载的文件数据(使用2011年Refaat的数据集)。

负载信用卡数据sc=信用记分卡(数据)
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x7 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'Predictor Vars:{1x10 cell}数据:[1200x11表格]

在本例中,属性的默认值ResponseVar,预测变量好标签在创建此对象时分配。默认情况下,属性ResponseVar设置为输入数据的最后一列中的变量名(“状态”在本例中)。财产预测变量包含中所有变量的名称VarNames,但不包括IDVarResponseVar. 另外,在上一个示例中,默认情况下,好标签设置为0,因为它是响应变量中的值(ResponseVar)的最高计数。

显示信用记分卡使用点表示法的对象属性。

sc.预测变量
ans=1x10电池第1列至第4列{'CustID'}{'CustAge'}{'TmAtAddress'}{'ResStatus'}第5列至第8列{'EmpStatus'}{'custinenue'}{'TmWBank'}{'OtherCC'}第9列至第10列{'AMBalance'}{'UtilRate'}
sc.VarNames
ans=1x11电池第1列至第4列{'CustID'}{'CustAge'}{'TmAtAddress'}{'ResStatus'}第5列至第8列{'EmpStatus'}{'custinenue'}{'TmWBank'}{'OtherCC'}第9列至第11列{'AMBalance'}{'UtilRate'}{'status'}

自从IDVar预测变量如果具有公共访问权限,则可以在命令行中更改其值。

sc.IDVar=“卡斯蒂德”
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x6 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'CustID'预测值:{1x9 cell}数据:[1200x11表格]
sc.vars={“CustIncome”,“雷斯塔特斯”,“大使”}
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{'CustIncome''AMBalance'}分类预测值:{'ResStatus'}BinMissingData:0 IDVar:'CustID'预测值:{'ResStatus''CustIncome AMBalance'}数据:[1200x11表格]
高级惩教主任(高级惩教主任)
creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: " VarNames: {1x11 cell} NumericPredictors: {'CustIncome' 'AMBalance'} CategoricalPredictors: {'ResStatus'} BinMissingData: 0 IDVar: 'CustID' PredictorVars: {'ResStatus' 'CustIncome' 'AMBalance'} Data: [1200x11 table]

创建一个信用记分卡使用CreditCardData.mat要加载的文件数据(使用2011年Refaat的数据集)。然后使用名称-值对参数信用记分卡界定好标签ResponseVar

负载信用卡数据sc=信用记分卡(数据,“IDVar”,“卡斯蒂德”,“GoodLabel”,0,“响应者”,“状态”)
sc=creditscorecard,属性:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x6 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:0 IDVar:'CustID'预测值:{1x9 cell}数据:[1200x11表格]

好标签ResponseVar只能在创建时设置(强制)信用记分卡对象使用信用记分卡

创建一个信用记分卡使用CreditCardData.mat要加载的文件数据缺失缺少值。

负载信用卡数据头部(数据缺失,5)
ans=5×11表(UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌乌877.23 0.29 0 4南75业主雇佣53000 20是157.37 0.08 0 5 68 56业主雇佣53000 14是561.84 0.11 0
fprintf('行数:%d\n',高度(数据缺失))
行数:1200
fprintf('缺少值的数量保管:%d\n',总和(ismissing(dataMissing.CustAge)))
缺少值的数量保管:30
fprintf(restatus: %d\n总和(ismissing (dataMissing.ResStatus)))
缺失值的数目:40

使用信用记分卡使用name-value参数“BinMissingData”着手符合事实的将丢失的数据装入单独的容器中。

sc=信用记分卡(数据缺失,“IDVar”,“卡斯蒂德”,“BinMissingData”,对);sc=自动绕线(sc);高级惩教主任(高级惩教主任)
具有属性的creditscorecard:GoodLabel:0 ResponseVar:'status'WeightsVar:'VarNames:{1x11 cell}数值预测值:{1x6 cell}分类预测值:{'ResStatus''EmpStatus''OtherCC'}BinMissingData:1 IDVar:'CustID'预测值:{1x9 cell}数据:[1200x11表格]

显示的数字数据的仓位信息“保管”包括在单独的容器中丢失的数据

bi=bininfo(sc,“保管”); 显示(bi)
本好不好悲哀InfoValue几率  _____________ ____ ___ ______ ________ __________ {'[- 正无穷,33)52}69 1.3269 -0.42156 0.018993{[33岁,37)}63年45 1.4 -0.36795 0.012839{[37、40)}72年47 1.5319 -0.2779 0.0079824{'[40岁,46)}172 89 1.9326 -0.04556 0.0004549{'[46岁,48)}59 25 2.36 0.15424 0.0016199{[48,51)}99年41 2.4146 0.17713 0.0035449{'[51,58)'} 157 62 2.5323 0.22469 0.0088407 {'[58,Inf]'} 93 25 3.72 0.60931 0.032198 {''} 19 11 1.7273 -0.15787 0.00063885 {' total '} 803 397 2.0227 NaN 0.087112
绘图仪(sc,“保管”)

图中包含一个轴。标题为CustAge的轴包含3个类型为bar、line的对象。这些对象表示好、坏。

显示的分类数据的bin信息“雷斯塔特斯”包括在单独的容器中丢失的数据

bi=bininfo(sc,“雷斯塔特斯”); 显示(bi)
(UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU27 13 2.0769 0.026469 2.3248e-05{‘总计}803 397 2.0227 NaN 0.0092627
绘图仪(sc,“雷斯塔特斯”)

图中包含一个坐标轴。标题为ResStatus的轴包含3个类型为bar, line的对象。这些对象代表好和坏。

参考文献

[1]安德森,R。信用评分工具包。牛津大学出版社,2007。

[2] 雷法特,M。使用SAS为数据挖掘做数据准备。摩根·考夫曼,2006年。

[3] 雷法特,M。信用风险记分卡:使用SAS开发和实施。露露网,2011年。

R2014b中引入