主要内容

使用观察重量的信用记分卡建模

创建一个CreditsCoreCard对象,用于输入的表数据参数要么定义或不定义观察权重。如果是数据不使用权重,然后是“计数”好的,,,,坏的, 和赔率由信用评分卡功能使用。但是,如果可选权重创建一个时指定参数CreditsCoreCard对象,然后是“计数”好的,,,,坏的, 和赔率是权重的总和。

例如,这是一个未定义观察权重的输入表的摘要:

输入表段用于创建CreditsCoreCard对象

如果您将客户年龄预测数据数据包含在一个垃圾箱中,最多可容纳45岁的客户,而在另一个垃圾箱中则46岁及以上,则可以获得这些统计信息:

“好”和“坏”的统计数据,可容纳45岁,46岁及第二个垃圾箱

好的指带有的行总数0价值地位响应变量。坏的的数量1地位柱子。赔率好的坏的。这好的,,,,坏的, 和赔率报告每个垃圾箱。这意味着样本中有381人在45岁及以下支付贷款,在同一年龄范围内的241人违约,因此,对该年龄段的好几率是1.581

假设建模者认为该样本中45岁及以下的人数不足。建模者希望给出所有年龄高达45个重量的行。假设建模者认为最多45岁的年龄组的重量应比46岁及以上的行高50%。表数据扩展到包括观察权重。一个重量列添加到表中,其中所有年龄在45岁及以下的行都具有1.5,以及所有其他行的重量1。使用权重的其他原因,例如,最近的数据点可能比旧数据点更高。

表明权重的表,具体取决于监护的预测指标

如果您根据年龄(45岁及以下,与46岁及以上)进行加权数据,则期望是每一行45岁及以下的行必须计算为1.5观察,因此好的坏的“计数”增加了50%:

表段展示了权重对“好”和“坏”的影响

“计数”现在是“加权频率”,不再是整数值。这赔率不要更改第一个垃圾箱。此示例中给出的特定权重可以缩放总数好的坏的在第一个垃圾箱中以相同的缩放系数计数,因此它们的比率不会改变。但是,那赔率总样本的价值确实改变了;现在,第一个垃圾箱的重量更高,并且由于该垃圾箱的几率较低,所以总重量赔率现在也较低。此处未显示的其他信用记分卡统计数据,例如信息价值以类似的方式受到影响。

通常,权重的效果不仅是在特定垃圾箱中缩放频率,因为该垃圾箱的成员将具有不同的权重。此示例的目的是证明从计数转换为权重总和的概念。

也可以看看

||||

相关话题