使用观察重量的信用记分卡建模
创建一个CreditsCoreCard
对象,用于输入的表数据
参数要么定义或不定义观察权重。如果是数据
不使用权重,然后是“计数”好的
,,,,坏的
, 和赔率
由信用评分卡功能使用。但是,如果可选权重
创建一个时指定参数CreditsCoreCard
对象,然后是“计数”好的
,,,,坏的
, 和赔率
是权重的总和。
例如,这是一个未定义观察权重的输入表的摘要:
如果您将客户年龄预测数据数据包含在一个垃圾箱中,最多可容纳45岁的客户,而在另一个垃圾箱中则46岁及以上,则可以获得这些统计信息:
好的
指带有的行总数0
价值地位
响应变量。坏的
的数量1
在地位
柱子。赔率
是好的
至坏的
。这好的
,,,,坏的
, 和赔率
报告每个垃圾箱。这意味着样本中有381人在45岁及以下支付贷款,在同一年龄范围内的241人违约,因此,对该年龄段的好几率是1.581
。
假设建模者认为该样本中45岁及以下的人数不足。建模者希望给出所有年龄高达45个重量的行。假设建模者认为最多45岁的年龄组的重量应比46岁及以上的行高50%。表数据扩展到包括观察权重。一个重量
列添加到表中,其中所有年龄在45岁及以下的行都具有1.5
,以及所有其他行的重量1
。使用权重的其他原因,例如,最近的数据点可能比旧数据点更高。
如果您根据年龄(45岁及以下,与46岁及以上)进行加权数据,则期望是每一行45岁及以下的行必须计算为1.5观察,因此好的
和坏的
“计数”增加了50%:
“计数”现在是“加权频率”,不再是整数值。这赔率
不要更改第一个垃圾箱。此示例中给出的特定权重可以缩放总数好的
和坏的
在第一个垃圾箱中以相同的缩放系数计数,因此它们的比率不会改变。但是,那赔率
总样本的价值确实改变了;现在,第一个垃圾箱的重量更高,并且由于该垃圾箱的几率较低,所以总重量赔率
现在也较低。此处未显示的其他信用记分卡统计数据,例如祸
和信息价值
以类似的方式受到影响。
通常,权重的效果不仅是在特定垃圾箱中缩放频率,因为该垃圾箱的成员将具有不同的权重。此示例的目的是证明从计数转换为权重总和的概念。
也可以看看
CreditsCoreCard
|自动启动
|Bininfo
|fitmodel
|valialatemodel