信用记分卡建模工作流
创建、建模并分析信用记分卡,如下所示。
使用
screenpredictors
(风险管理工具箱)从风险管理工具箱™中,将潜在的大型预测因子集缩减为最能预测信用评分卡响应变量的子集。类时使用此预测符子集creditscorecard
对象。另外,可以使用阈值预测(风险管理工具箱)使用的输出交互地设置信用记分卡预测器阈值screenpredictors
(风险管理工具箱).创建一个
creditscorecard
对象通过以表格格式指定“培训”数据来进行信用记分卡分析。训练数据,有时称为建模视图,是多个数据准备任务的结果(参见关于信用记分卡),在创建creditscorecard
对象。可以使用可选的输入参数
creditscorecard
来指定记分卡属性,例如响应变量和GoodLabel
.时执行一些初始数据探索creditscorecard
对象被创建,尽管数据分析通常与数据装箱一起完成(参见步骤2)。有关更多信息和示例,请参见creditscorecard
第一步信用记分卡分析案例研究.创建一个
creditscorecard
对象使用训练数据。当你创建
creditscorecard
对象用于信用记分卡,您可以以表格格式指定“培训”数据。训练数据,有时称为建模视图,是多个数据准备任务的结果(参见关于信用记分卡),在创建creditscorecard
对象。可以使用可选的输入参数
creditscorecard
来指定记分卡属性,例如响应变量和GoodLabel
.时执行一些初始数据探索creditscorecard
对象被创建,尽管数据分析通常与数据装箱一起完成(参见步骤2)。有关更多信息和示例,请参见creditscorecard
第一步信用记分卡分析案例研究.Bin数据。
中加载的数据执行手动或自动装箱
creditscorecard
对象。常用的起点是对所有或选定的变量应用自动分箱
autobinning
,报告使用情况bininfo
,并将有关箱子计数和统计数据或关联度量(如使用证据权重(WOE))的箱子信息可视化plotbins
.可以手动修改或微调容器modifybins
或者用不同的自动分箱算法使用autobinning
.在WOE中显示接近线性趋势的箱子通常是信用记分卡上下文中需要的。或者,对于风险管理工具箱,您可以使用装箱的探险家应用程序交互bin。的装箱的探险家使您能够交互式地应用分箱算法和修改分箱。有关更多信息,请参见装箱的探险家(风险管理工具箱).
有关更多信息和示例,请参见
autobinning
,modifybins
,bininfo
,plotbins
第二步信用记分卡分析案例研究.拟合逻辑回归模型。
拟合逻辑回归模型的WOE数据
creditscorecard
对象。的fitmodel
函数内部对训练数据进行存储,将其转换为WOE值,映射响应变量,使‘好’
是1
,并拟合线性logistic回归模型。默认情况下,
fitmodel
使用逐步过程来确定哪些预测器应该在模型中,但是也可以使用可选的输入参数来拟合完整的模型。有关更多信息和示例,请参见fitmodel
第三步信用记分卡分析案例研究.或者,您可以应用相等、不相等或绑定约束,使逻辑回归模型适合于来自的WOE数据
creditscorecard
对象使用fitConstrainedModel
.审查和格式信用记分卡点。
拟合logistic模型后,使用
displaypoints
总结记分卡上的分数。默认情况下,这些点是未缩放的,直接来自证据权重(WOE)值和模型系数的组合。的
formatpoints
函数允许您控制计分卡点的缩放和舍入。有关更多信息和示例,请参见displaypoints
而且formatpoints
第四步信用记分卡分析案例研究.您可以选择使用创建一个紧凑的信用记分卡
要创建
compactCreditScorecard
对象,使用紧凑的
要创建compactCreditScorecard
对象。然后可以使用以下函数displaypoints
(风险管理工具箱),分数
(风险管理工具箱),probdefault
(风险管理工具箱)的风险管理工具箱中的compactCreditScorecard
对象. .对数据进行评分。
的
分数
函数计算训练数据的分数。可选的数据输入也可以传递给
分数
例如,验证数据。每个客户的每个预测器的点数也作为可选输出提供。有关更多信息和示例,请参见分数
第五步信用记分卡分析案例研究.计算信用记分卡分数的违约概率。
的
probdefault
函数用于计算训练数据的违约概率。方法计算不同数据集(例如,验证数据集)的默认可能性
probdefault
函数。有关更多信息和示例,请参见probdefault
第六步信用记分卡分析案例研究.验证信用记分卡模型。
使用
validatemodel
函数来验证信用记分卡模型的质量。方法可以获得给定数据集的累积精度轮廓(CAP)、接收器工作特征(ROC)和Kolmogorov-Smirnov (KS)图和统计信息
validatemodel
函数。有关更多信息和示例,请参见validatemodel
第七步信用记分卡分析案例研究.
有关此工作流的示例,请参见信用记分卡分析案例研究.
另请参阅
creditscorecard
|autobinning
|bininfo
|predictorinfo
|modifypredictor
|modifybins
|bindata
|plotbins
|fitmodel
|displaypoints
|formatpoints
|分数
|setmodel
|probdefault
|validatemodel