主要内容

modelDiscriminationPlot

绘制ROC曲线

自从R2021a

描述

例子

modelDiscriminationPlot (pdModel,数据)情节接受者操作特征曲线(ROC)。modelDiscriminationPlot金宝app支持分割对参考模型和比较。

例子

modelDiscriminationPlot (___,名称,值)指定选项使用一个或多个名称-值对参数除了输入参数在前面的语法。

例子

h= modelDiscriminationPlot (斧头,___,名称,值)指定选项使用一个或多个名称-值对参数除了在前面的语法输入参数并返回图处理h

例子

全部折叠

这个例子展示了如何使用modelDiscriminationPlot绘制ROC曲线。

加载数据

加载信贷投资组合数据。

负载RetailCreditPanelData.matdisp(头(数据))
ID ScoreGroup小无赖默认年__ __________ ___ ____ ____ 1低风险1 0 1998 1997 1低风险2 0 1低风险1999 1低风险4 0 0 2001 2000 1低风险5 0 1低风险6 0 2002 1低风险7 0 2003 1低风险8 0 2004
disp(头(dataMacro))
1998年国内生产总值__专攻市场1997 2.72 - 7.61 3.57 - 26.24 1999 2.86 2001 18.1 2000 2.43 3.19 1.26 -10.51 2002 -0.59 2004 -22.95 2003 0.63 - 2.78 1.85 - 9.48

加入到一个数据集的两个数据组件。

data =加入(数据、dataMacro);disp(头(数据))
ID ScoreGroup小无赖违约GDP年市场__ __________ ___ ____ ____专攻1低风险1 0 1997 2.72 7.61 - 1低风险2 0 1998 1999 2.86 18.1 3.57 26.24 - 1低风险3 0 1低风险4 0 2000 2.43 3.19 1低风险5 0 2002 2001 1.26 -10.51 - 1低风险6 0 -0.59 -22.95 1低风险7 0 2003 0.63 2.78 1低风险8 0 2004 1.85 - 9.48

对数据进行分区

单独的数据为训练和测试的分区。

nIDs = max (data.ID);uniqueIDs =独特(data.ID);rng (“默认”);%的再现性c = cvpartition (nIDs“坚持”,0.4);TrainIDInd =培训(c);TestIDInd =测试(c);TrainDataInd = ismember (data.ID uniqueIDs (TrainIDInd));TestDataInd = ismember (data.ID uniqueIDs (TestIDInd));

创建物流一生PD模型

使用fitLifetimePDModel创建一个物流使用训练数据模型。

pdModel = fitLifetimePDModel(数据(TrainDataInd,:),“物流”,“ModelID”,“例子”,“描述”,“终身使用RetailCreditPanelData PD模型”。,“IDVar”,“ID”,“AgeVar”,“小无赖”,“LoanVars”,“ScoreGroup”,“MacroVars”,{“国内生产总值”“市场”},“ResponseVar”,“默认”);disp (pdModel)
物流与属性:ModelID:“例子”描述:“终身使用RetailCreditPanelData PD模型。”UnderlyingModel: [1x1 classreg.regr.CompactGeneralizedLinearModel] IDVar: "ID" AgeVar: "YOB" LoanVars: "ScoreGroup" MacroVars: ["GDP" "Market"] ResponseVar: "Default"
disp (pdModel.UnderlyingModel)
紧凑的广义线性回归模型:分对数(默认)~ 1 + GDP ScoreGroup +小无赖+ +市场=二项分布估计系数:估计SE tStat pValue __________ ___________和___________(拦截)-2.7422 0.10136 -27.054 3.408 e - 161 ScoreGroup_Medium风险-0.68968 0.037286 -18.497 2.1894 e - 76 ScoreGroup_Low风险-1.2587 0.045451 -27.693 8.4736 e - 169小无赖-0.30894 0.013587 -22.738 1.8738 e - 114 GDP市场-0.11111 0.039673 -2.8006 0.0051008 -0.0083659 0.0028358 -2.9502 0.0031761 388097年观察,388091错误自由度色散:1 x ^ 2-statistic与常数模型:1.85 e + 03,假定值= 0

可视化模型的歧视

使用modelDiscriminationPlot中华民国情节的测试数据。

modelDiscriminationPlot (pdModel、数据(TestDataInd:))

图包含一个坐标轴对象。坐标轴对象与标题中华民国的例子,AUROC = 0.70009,包含一部分Non-Defaulters, ylabel违约者的包含一个类型的对象。这个对象表示的例子。

输入参数

全部折叠

违约概率模型,指定为一个物流,Probit,或考克斯之前创建的对象使用fitLifetimePDModel。或者,您可以创建一个定制的违约概率模型使用customLifetimePDModel

请注意

“ModelID”财产的pdModel对象是用作标识符或标记pdModel

数据类型:对象

数据,指定为一个NumRows——- - - - - -NumCols表与预计值预测寿命预测。预测的名称和数据类型必须与底层模型一致。

数据类型:

(可选)有效轴对象,指定为一个斧头使用创建的对象。情节将在指定的轴创建可选的斧头论点,而不是在当前轴(gca)。可选参数斧头必须先于任何输入参数的组合。

数据类型:对象

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:modelDiscriminationPlot (pdModel数据(印第安纳州,:),“DataID”,“DataSetChoice”)

数据集标识符指定为逗号分隔组成的“DataID”和一个字符或字符串向量。的DataID情节中包含标题为报告目的。

数据类型:字符|字符串

的名字列在数据输入,不一定一个模型变量,用于分割的数据集,指定为逗号分隔组成的“SegmentBy”和一个字符或字符串向量。modelDiscriminationPlot每段情节一个中华民国。

数据类型:字符|字符串

有条件的PD值预测数据参考模型,指定为逗号分隔组成的“ReferencePD”和一个NumRows——- - - - - -1数值向量。中华民国曲线输出信息的策划pdModel对象和参考模型。

数据类型:

标识符的参考模型,指定为逗号分隔组成的“ReferenceID”和一个字符或字符串向量。“ReferenceID”用于报告目的的阴谋。

数据类型:字符|字符串

输出参数

全部折叠

图线的处理对象,作为处理对象返回。

更多关于

全部折叠

模型的歧视

模型的歧视措施的风险排名。

高风险贷款应该得到预测违约概率(PD)高于低风险贷款。的modelDiscrimination函数计算接收器算子特性曲线下的面积(AUROC),有时被称为简单曲线下的面积(AUC)。这个指标指的是在0和1之间,值越大表示更好的歧视。

接收者算子特征(ROC)曲线是一个阴谋的参数曲线的比例

  • 违约者和PD高于或等于PD值的引用p

  • 与PD Nondefaulters高于或等于同一参考PD的价值p

参考PD价值p参数化曲线,预测软件横扫独特的PD值观察数据集。实际违约者的比例分配一个PD高于或等于p是真正的积极的速度。实际nondefaulters分配一个PD的比例高于或等于p假阳性的速度。”For more information about ROC curves, seeROC曲线和性能指标

AUROC报道创造的情节modelDiscriminationPlot。AUROC度量以编程方式,使用modelDiscrimination

引用

[1]Baesens,巴特,丹尼尔•罗斯切和Harald Scheule。信贷风险分析:测量技术、应用程序和SAS的例子。威利,2016年。

[2]贝里尼,Tiziano。IFRS 9和CECL信用风险建模和验证:一个实用指南的例子在R和SAS。圣地亚哥CA:爱思唯尔出版社,2019年。

[3]布里登,约瑟夫。生活在CECL:建模字典。圣达菲,海里:先见之明模型有限责任公司,2018年。

[4]罗斯切,丹尼尔和哈拉尔德Scheule。与Python深信用风险:机器学习。独立出版,2020年。

版本历史

介绍了R2021a

全部展开