比较托比特书乐金显示器模型基准模型

这个例子展示了如何比较托比特书模型对于损失给定的默认(乐金显示器)基准模型。

加载数据

加载乐金显示器数据。

负载LGDData.matdisp(头(数据))

LTV年龄类型乐金显示器____ ____ ___________ _____住宅住宅0.43564 0.72078 2.7948 0.032659 0.70176 2.0939 0.89101 - 0.39716住宅住宅住宅0 0.007947 0.36492 2.5818 0.0064766 0.37013 1.237 0.796 - 1.5957住宅投资住宅0.025688 0.92005 0.50253 0.14572 0.60203 1.1599 0.063182

将数据分为训练集和测试集。

NumObs =身高(数据);rng (“默认”);%的再现性c = cvpartition (NumObs“坚持”,0.4);TrainingInd =培训(c);TestInd =测试(c);

符合托比特书模式

适合托比特书乐金显示器与训练数据模型。默认情况下,最后一列的数据作为响应变量和所有其他列作为预测变量。

lgdModel = fitLGDModel(数据(TrainingInd,:),“托比特书”);disp (lgdModel)

托比特书的属性:CensoringSide:““LeftLimit: 0 RightLimit: 1 ModelID:“托比特书”的描述:“UnderlyingModel: [1 x1 risk.internal.credit.TobitModel] PredictorVars: [“LTV”“年龄”“类型”]ResponseVar:“乐金显示器”

disp (lgdModel.UnderlyingModel)

托比特书回归模型:乐金显示器= max(0分钟(Y *, 1) Y * ~ 1 + LTV +年龄+类型估计系数:估计SE tStat pValue替_________ __________(拦截)0.058257 0.20126 0.031383 6.4129 1.7592 0.027279 2.1356 0.032828 LTV平台以及年龄0 Type_investment 0.10208 0.018054 5.6544 -0.095407 0.0072435 -13.171 1.7785 e-08(σ)0.29288 0.0057071 51.318 0的观测数量:2093 left-censored观察:547数量的未经审查的观察:1521 right-censored观测数量:25对数似:-698.383

您现在可以使用这个模型来预测或验证。例如,使用预测预测乐金显示器测试数据和可视化预测直方图。

lgdPredTobit =预测(lgdModel、数据(TestInd:));直方图(lgdPredTobit)标题(“预测乐金显示器,托比特书模式”)包含(“预测乐金显示器”)ylabel (“频率”)

图包含一个坐标轴对象。坐标轴对象与标题预测乐金显示器,托比特书模型,包含预测乐金显示器,ylabel频率包含一个直方图类型的对象。

创建基准模型

在这个例子中,基准模型是一个查找表模型,部分数据的组织和分配平均乐金显示器组所有成员。在实践中,这种常见的基准测试方法是容易理解和使用。

组在本例中使用的三个定义预测。LTV离散成低和高水平。年龄离散成年轻和年老的贷款。类型已经有两个层次,即居住和投资。组织所有这些值的组合(例如,低LTV,年轻的贷款,住房,等等)。水平的数量和具体的截止点只是出于演示目的。基准模型使用相同的预测因子托比特书模型在这个例子中,但是您可以使用其他变量定义组。事实上,基准模型可能是一个黑盒模型,只要预测乐金显示器值可用于相同的客户在这个数据集。

%添加新表中的科勒姆离散变量。% LTV离散化。LTVEdges =[0 0.5马克斯(data.LTV)];数据。LTVDiscretized = discretize(data.LTV,LTVEdges,“分类”,{“低”,“高”});%离散化的时代。AgeEdges =[0 2马克斯(data.Age)];数据。年龄Discretized = discretize(data.Age,AgeEdges,“分类”,{“年轻”,“老”});%类型已经是类别变量和两个水平。

发现该组织意味着在训练数据是有效的拟合模型。请注意,某些群体的组数小。添加许多团体有减少组数对一些团体和更不稳定的估计。

%找到组织意味着在训练数据。gs = groupsummary(数据(TrainingInd,:), {“LTVDiscretized”,“AgeDiscretized”,“类型”},“的意思是”,“乐金显示器”);disp (gs)

是_____________ ___________ __________ ________ LTVDiscretized AgeDiscretized类型GroupCount mean_LGD * * *低年轻住宅163 0.12166低投资26 0.087331低老少住宅175 0.021776低老投资23 0.16379高年轻住宅1134 0.16489高的年轻265 0.066068 257 0.25977高的旧住宅投资高老投资50 0.11779

预测一个新观察乐金显示器,你需要找到它的组,然后分配组意味着预测乐金显示器。使用findgroups函数,它将离散变量作为输入。对于一个全新的数据点,LTV和年龄信息需要离散第一次使用离散化在你使用的函数findgroups函数。

LGDGroup = findgroups(数据(TestInd, {“LTVDiscretized”“AgeDiscretized”“类型”}));lgdPredMeansTest = gs.mean_LGD (LGDGroup);

有八个惟一值预测,正如预期的那样,一个为每个组。

disp(独特(lgdPredMeansTest))

0.0218 0.0661 0.0873 0.1178 0.1217 0.1638 0.1649 0.2598

预测的柱状图也显示了离散模型的性质。

直方图(lgdPredMeansTest)标题(“预测乐金显示器,托比特书模式”)包含(“预测乐金显示器”)ylabel (“频率”)

图包含一个坐标轴对象。坐标轴对象与标题预测乐金显示器,托比特书模型,包含预测乐金显示器,ylabel频率包含一个直方图类型的对象。

所有可用的预测对训练集和测试集进行比较,添加一个列与乐金显示器预测对整个数据集。

LGDGroup = findgroups(数据(:,{“LTVDiscretized”“AgeDiscretized”“类型”}));数据。lgdPredMeans = gs.mean_LGD (LGDGroup);

比较性能

托比特书的性能模型和比较基准模型使用的验证功能托比特书模型。

从接受者操作特征(ROC)曲线下的面积,或AUROC度量,使用modelDiscrimination。

DataSetChoice =“测试”;如果DataSetChoice = =“培训”印第安纳州= TrainingInd;其他的印第安纳州= TestInd;结束DiscMeasure = modelDiscrimination (lgdModel、数据(印第安纳州,:)“ShowDetails”,真的,“ReferenceLGD”data.lgdPredMeans(印第安纳州),“ReferenceID”,“组意味着”)

DiscMeasure =2×3表AUROC段SegmentCount _________ __________ _______托比特书0.67986“all_data”1394组意味着0.61251“all_data”1394

使用modelDiscriminationPlot可视化ROC曲线。

modelDiscriminationPlot (lgdModel数据(印第安纳州,:),“ReferenceLGD”data.lgdPredMeans(印第安纳州),“ReferenceID”,“组意味着”)

图包含一个坐标轴对象。坐标轴对象标题ROC托比特书,AUROC = 0.67986组意味着,AUROC = 0.61251,包含假阳性,ylabel真阳性率包含2线类型的对象。这些对象代表托比特书,集团的意思。

使用modelCalibration计算校正指标。

CalMeasure = modelCalibration (lgdModel、数据(印第安纳州,:)“ReferenceLGD”data.lgdPredMeans(印第安纳州),“ReferenceID”,“组意味着”)

CalMeasure =2×4表RSquared RMSE相关性SampleMeanError ________ _________ ___________售予托比特书0.08527意味着0.041622 0.2406 0.20401 -0.0078124 0.23712 0.29201 -0.034412组

使用modelCalibrationPlot的散点图来可视化观察乐金显示器值对预测乐金显示器值。

modelCalibrationPlot (lgdModel数据(印第安纳州,:),“ReferenceLGD”data.lgdPredMeans(印第安纳州),“ReferenceID”,“组意味着”)

图包含一个坐标轴对象。坐标轴对象与标题散射托比特书,平方:0.08527组意味着,平方:0.041622,包含乐金显示器预测,ylabel乐金显示器观察包含4散射类型的对象,线。这些对象表示数据,托比特书,健康,托比特书,数据组意味着健康,组的意思。

然后您可以使用modelCalibrationPlot的散点图来可视化预测乐金显示器值对LTV值。

modelCalibrationPlot (lgdModel数据(印第安纳州,:),“ReferenceLGD”data.lgdPredMeans(印第安纳州),“ReferenceID”,“组意味着”,“XData”,“值”,“YData”,“预测”)

图包含一个坐标轴对象。坐标轴对象与标题散射托比特书,平方:0.33027组意味着,平方:0.16852,包含LTV, ylabel乐金显示器预测包含4散射类型的对象,线。这些对象表示数据,托比特书,健康,托比特书,数据组意味着健康,组的意思。

另请参阅