主要内容gydF4y2Ba

predictLifetimegydF4y2Ba

计算累积寿命PD、边际PD和生存概率gydF4y2Ba

描述gydF4y2Ba

例子gydF4y2Ba

LifetimePredictedpd.gydF4y2Ba= predictLifetime (gydF4y2Bapdmodel.gydF4y2Ba,gydF4y2Ba数据gydF4y2Ba)gydF4y2Ba计算默认的累积寿命概率(PD)、边际PD和生存概率。gydF4y2Ba

例子gydF4y2Ba

LifetimePredictedpd.gydF4y2Ba= predictLifetime (gydF4y2Ba___gydF4y2Ba,gydF4y2Ba名称,值gydF4y2Ba)gydF4y2Ba除了以前语法中的输入参数之外,使用一个或多个名称值对参数指定选项。gydF4y2Ba

例子gydF4y2Ba

全部折叠gydF4y2Ba

此示例显示了如何使用gydF4y2Bafitlifetimepdmodel.gydF4y2Ba将数据与gydF4y2BaProbitgydF4y2Ba模型,并预测其违约概率。gydF4y2Ba

加载数据gydF4y2Ba

加载信用投资组合数据。gydF4y2Ba

负载gydF4y2BaRetailcreditPaneldata.mat.gydF4y2BaDISP(头(数据))gydF4y2Ba
ID分数yob默认年份_____________________ _______ ____ 1低风险1 0 1997 1低风险2 1998 1低风险3 0 1999 1低风险5 0 2001 1低风险6 0 2002 1低风险72003年1 1个低风险2004年8月0日gydF4y2Ba
disp(头(dataMacro))gydF4y2Ba
年GDP市场____ _____ _________________ 1997 2.72 7.61 1998 3.57 26.24 1999 2.86 18.1 2000 2.43 3.19 2001 1.26 -10.51 2002 -0.59 -22.95 2003 0.63 2.78 2004 1.85 9.48gydF4y2Ba

将两个数据组件连接到单个数据集中。gydF4y2Ba

data =加入(数据、dataMacro);DISP(头(数据))gydF4y2Ba
ID分数yob默认年份GDP市场____________________________ ______ 1低风险1 0 1997 2.72 7.61 1低风险2 1999 3.57 26.1 1低风险4 0 2000 2.43 3.19 1低风险50 2001 1.26 -10.51 1低风险6 0 2002-0.59 -22.95 1低风险7 0 2003 0.63 2.78 1低风险8 0 2004 1.85 9.48gydF4y2Ba

对数据进行分区gydF4y2Ba

将数据划分为训练和测试分区。gydF4y2Ba

nIDs = max (data.ID);uniqueIDs =独特(data.ID);rng (gydF4y2Ba'默认'gydF4y2Ba);gydF4y2Ba%的再现性gydF4y2Bac = cvpartition (nIDsgydF4y2Ba'坚持'gydF4y2Ba,0.4);Trainidind =培训(c);testidind =测试(c);TrainDataind = ISMember(data.id,uniqueids(trainidind));testdataind = ismember(data.id,uniqueids(testidind));gydF4y2Ba

创建一个gydF4y2BaProbitgydF4y2Ba一生PD模型gydF4y2Ba

使用gydF4y2Bafitlifetimepdmodel.gydF4y2Ba创建一个gydF4y2BaProbitgydF4y2Ba使用训练数据建立模型。gydF4y2Ba

pdModel = fitLifetimePDModel(数据(TrainDataInd,:),gydF4y2Ba“探测”gydF4y2Ba,gydF4y2Ba......gydF4y2Ba'agevar'gydF4y2Ba,gydF4y2Ba“小无赖”gydF4y2Ba,gydF4y2Ba......gydF4y2Ba'idvar'gydF4y2Ba,gydF4y2Ba“ID”gydF4y2Ba,gydF4y2Ba......gydF4y2Ba“LoanVars”gydF4y2Ba,gydF4y2Ba“ScoreGroup”gydF4y2Ba,gydF4y2Ba......gydF4y2Ba“MacroVars”gydF4y2Ba, {gydF4y2Ba'gdp'gydF4y2Ba,gydF4y2Ba“市场”gydF4y2Ba},gydF4y2Ba......gydF4y2Ba“ResponseVar”gydF4y2Ba,gydF4y2Ba'默认'gydF4y2Ba);DISP(PDMODEL)gydF4y2Ba
描述:""模型:[1x1 classreg.regr. "CompactGeneralizedLinearModel] IDVar: "ID" AgeVar: "YOB" LoanVars: "ScoreGroup" MacroVars: ["GDP" "市场"]ResponseVar: "Default"gydF4y2Ba

显示底层模型。gydF4y2Ba

disp(pdmodel.model)gydF4y2Ba
紧凑广义线性回归模型:probit(Default) ~ 1 + ScoreGroup + YOB + GDP + Market Distribution =二项式估计系数:evaluate SE tStat pValue __________ _________ _______ ___________ (Intercept) -1.6267 0.03811 -42.685 0 ScoreGroup_Medium Risk -0.26542 0.01419 -18.704 4.5503e-78 ScoreGroup_Low Risk -0.26542 0.016364 -28.595 7.7503e -180 YOB -0.11421 0.0049724 -22.969 9.6208e-117 GDP -0.041537 0.014807 -2.8052 0.0050291 Market -0.0029609 0.0010618 -2.7885 0.0052954离散:1 Chi^2-statistic vs. constant model: 1.85e+03, p-value = 0gydF4y2Ba

根据训练和测试数据预测终身PDgydF4y2Ba

使用gydF4y2BapredictLifetimegydF4y2Ba函数获取训练或测试数据的终身pd。要获得条件pd,请使用gydF4y2Ba预测gydF4y2Ba函数。对于模型验证,使用gydF4y2BamodelDiscriminationgydF4y2Ba和gydF4y2BamodelAccuracygydF4y2Ba在培训或测试数据上的功能。gydF4y2Ba

DataSetchoice =.gydF4y2Ba“测试”gydF4y2Ba;gydF4y2Ba如果gydF4y2BaDataSetchoice ==.gydF4y2Ba“训练”gydF4y2Baind = traindataind;gydF4y2Ba其他的gydF4y2BaInd = testdataind;gydF4y2Ba结束gydF4y2Ba预测寿命PDgydF4y2BaPD = predictLifetime (pdModel、数据(印第安纳州,:));头(数据(印第安纳州,:))gydF4y2Ba
ans =.gydF4y2Ba8×7表gydF4y2BaID ScoreGroup小无赖默认的年国内生产总值(GDP)市场  __ ___________ ___ _______ ____ _____ ______ 2中等风险1 0 1997 2.72 - 7.61 2中等风险2 0 1999 1998 3.57 26.24 - 2中等风险3 0 2.86 18.1 - 2中等风险4 0 2000 2.43 3.19 - 2中等风险5 0 2001 1.26 - -10.51 2中等风险6 0 2002 -0.59 -22.95 - 2中等风险7 0 2003 0.63 2.78 - 2中等风险8 0 20041.85 - 9.48gydF4y2Ba

预测新数据上的寿命PDgydF4y2Ba

寿命PD模型用于对现有贷款进行预测。的gydF4y2BapredictLifetimegydF4y2Ba函数要求贷款和宏观预测器在贷款剩余时间的预测值。gydF4y2Ba

的gydF4y2Badatapredictlifetime.matgydF4y2Ba文件包含两个贷款和宏观变量的预测。一笔贷款2019年底期限为3年,终身期限为10年,另一笔贷款期限为6年,终身期限为10年。的gydF4y2BaScoreGroupgydF4y2Ba是常数,年龄值是递增的。对于宏观变量,对宏观预测者的预测必须跨越投资组合中最长的生命周期。gydF4y2Ba

负载gydF4y2Badatapredictlifetime.matgydF4y2Badisp (LoanData)gydF4y2Ba
ID ScoreGroup小无赖一年  ____ _____________ ___ ____ 1304“中等风险”4 2020 1304“中等风险”5 2021 1304 6 2022 1304“中等风险”“中等风险”7 2023 1304“中等风险”8 2024 1304 9 2025 1304“中等风险”“中等风险”10 2026 2067“低风险”7 2020 2067“低风险”8 2021 2067“低风险”9 2022 2067 2023“低风险”gydF4y2Ba
disp (MacroScenario)gydF4y2Ba
GDP市场____ ___ ______ 2020 1.1 4.5 2021年0.9 1.5 2022年1.2 5 2023 1.4 5.5 2024 1.6 6 2025 1.8 6.5 2026 1.8 6.5 2027 1.8 6.5gydF4y2Ba
LifetimeData =加入(LoanData MacroScenario);disp (LifetimeData)gydF4y2Ba
ID分数yob年GDP市场_________________ ________ ___________________1304“中等风险”4 2020 1.1 4.5 1304“中等风险”5 2021 0.9 1.5 1304“中等风险”6 2022 1.2 5 1304“中等风险”7 2023 1.4 5.5 1304“中等风险“8 2024 1.6 6 1304”中等风险“9 2025 1.8 6.5 1304”中等风险“10 2026 1.8 6.5 2067”低风险“7 2020 1.1 4.5 2067”低风险“8 2021 0.9 1.5 2067”低风险“9 20221.2 5 2067“低风险”10 2023 1.4 5.5gydF4y2Ba

为方便起见,预测生存期pd并将输出存储为一个新的表列。gydF4y2Ba

LifetimeData。PredictedPD = predictLifetime(pdModel,LifetimeData); disp(LifetimeData)
ID ScoreGroup小无赖PredictedPD GDP年市场  ____ _____________ ___ ____ ___ ______ ___________ 1304“中等风险”4 2020 1.1 4.5 0.0080202 1304“中等风险”5 2021 0.9 1.5 0.014093 1304 6 2022 1.2 1304 0.018156“中等风险”“中等风险”7 2023 1.4 5.5 0.020941 1304 8 2024 1.6 0.022827 1304年“中等风险”“中等风险”9 2025 1.8 - 6.50.024086 1304“中风险”10 2026 1.8 6.5 0.024945“低风险”7 2020 1.1 4.5 0.0015728“低风险”8 2021 0.9 1.5 0.0027146“低风险”9 2022 1.2 5 0.003431“低风险”10 2023 1.4 5.5 0.0038939gydF4y2Ba

可视化一个公司的预期寿命。gydF4y2Ba

CompanyidChoice =gydF4y2Ba“1304”gydF4y2Ba;CompanyID = str2double (CompanyIDChoice);IndPlot = LifetimeData.ID = = CompanyID;情节(LifetimeData.YOB (IndPlot) LifetimeData.PredictedPD (IndPlot))网格gydF4y2Ba在gydF4y2BaXlabel(gydF4y2Ba“小无赖”gydF4y2Ba) xticks (LifetimeData.YOB (IndPlot) ylabel (gydF4y2Ba“一生PD”gydF4y2Ba)标题(strcat (gydF4y2Ba“公司 ”gydF4y2Ba,公司idchoice))gydF4y2Ba

图中包含一个轴对象。标题为Company 1304的axis对象包含一个类型为line的对象。gydF4y2Ba

这个例子展示了时间间隔在生命周期预测中扮演的重要角色gydF4y2Ba物流gydF4y2Ba,gydF4y2BaProbitgydF4y2Ba, 或者gydF4y2Ba考克斯gydF4y2Ba违约概率(PD)模型。每个PD的概率值是默认为给定的“时间间隔”(例如,1年的时间间隔),寿命预测中传递的数据行必须有相同的周期性时间间隔(也就是说,您不能通过一行代表四分之一,然后一行代表一年,然后是5年。您必须传递周期1,2,3,4,…的数据。而不是1、3、7、10、20。或者如果时间间隔是3,您必须通过周期3、6、9、…或者2 5 8…,but not 3, 7, 15, 30.

适合和验证模型gydF4y2Ba

负载gydF4y2BaRetailcreditPaneldata.mat.gydF4y2Badata =加入(数据、dataMacro);头(数据)gydF4y2Ba
ans =.gydF4y2Ba8×7表gydF4y2BaID分数yob默认年份GDP市场____________________________ ______ 1低风险1 0 1997 2.72 7.61 1低风险2 1999 3.57 26.1 1低风险4 0 2000 2.43 3.19 1低风险50 2001 1.26 -10.51 1低风险6 0 2002-0.59 -22.95 1低风险7 0 2003 0.63 2.78 1低风险8 0 2004 1.85 9.48gydF4y2Ba

选择模型类型。数据验证的行为gydF4y2BapredictLifetimegydF4y2Ba取决于模型类型。有关更多信息,请参见gydF4y2Ba验证生命周期预测的数据输入gydF4y2Ba.gydF4y2Ba

此示例中的时间间隔是gydF4y2Ba1gydF4y2Ba.该值存储在gydF4y2Ba考克斯gydF4y2Ba模型作为gydF4y2Ba时间间隔gydF4y2Ba属性,它用于拟合和预测。gydF4y2Ba物流gydF4y2Ba和gydF4y2BaProbitgydF4y2Ba模型不存储时间间隔信息。gydF4y2Ba

modeltype =gydF4y2Ba“考克斯”gydF4y2Ba;pdModel = fitLifetimePDModel(数据、ModelTypegydF4y2Ba......gydF4y2Ba'idvar'gydF4y2Ba,gydF4y2Ba“ID”gydF4y2Ba,gydF4y2Ba'agevar'gydF4y2Ba,gydF4y2Ba“小无赖”gydF4y2Ba,gydF4y2Ba......gydF4y2Ba“LoanVars”gydF4y2Ba,gydF4y2Ba“ScoreGroup”gydF4y2Ba,gydF4y2Ba“MacroVars”gydF4y2Ba, {gydF4y2Ba'gdp'gydF4y2Ba“市场”gydF4y2Ba},gydF4y2Ba......gydF4y2Ba“ResponseVar”gydF4y2Ba,gydF4y2Ba'默认'gydF4y2Ba);DISP(PDMODEL)gydF4y2Ba
属性Cox: TimeInterval: 1 ExtrapolationFactor: 1 ModelID:“Cox”描述:“”模型:[1x1 CoxModel] IDVar:“ID”AgeVar:“YOB”LoanVars:“ScoreGroup”MacroVars:[“GDP”“市场”]ResponseVar:“违约”gydF4y2Ba

条件PD和模型验证gydF4y2Ba

返回的条件PD值gydF4y2Ba预测gydF4y2Ba与用于训练模型的时间间隔一致。在本例中,返回的所有PD值为gydF4y2Ba预测gydF4y2Ba是1年的违约概率。对输入的数据没有周期性的验证gydF4y2Ba预测gydF4y2Ba.gydF4y2Ba

datapredictexample = data([1 2 6 10 15],:);pdexample =预测(pdmodel,datapredictexample)gydF4y2Ba
pdexample =gydF4y2Ba5×1gydF4y2Ba0.0089 0.0052 0.0038 0.0094 0.0031gydF4y2Ba

通过返回的条件PD完成模型验证gydF4y2Ba预测gydF4y2Ba.因此,没有行周期性验证gydF4y2BamodelDiscriminationgydF4y2Ba或gydF4y2BamodelAccuracygydF4y2Ba.然而,模型验证需要响应变量的观测值,验证响应值的默认定义必须与训练一致gydF4y2Ba数据gydF4y2Ba.换句话说,如果训练gydF4y2Ba数据gydF4y2Ba使用的时间间隔gydF4y2Ba1gydF4y2Ba,验证响应数据不能用季度默认数据定义。没有行周期性检查gydF4y2BamodelDiscriminationgydF4y2Ba或gydF4y2BamodelAccuracygydF4y2Ba,则假设验证数据中的默认定义与训练数据一致。gydF4y2Ba

modelAccuracyPlot (pdModel、数据{gydF4y2Ba“小无赖”gydF4y2Ba,gydF4y2Ba“ScoreGroup”gydF4y2Ba})gydF4y2Ba

图中包含一个轴对象。标题为Scatter Grouped by YOB and ScoreGroup Cox, RMSE = 0.0003732的轴对象包含6个类型为line的对象。这些对象代表高风险,观察到的,中度风险,观察到的,低风险,观察到的,高风险,考克斯,中度风险,考克斯,低风险,考克斯。gydF4y2Ba

寿命PD.gydF4y2Ba

的gydF4y2BapredictLifetimegydF4y2Ba函数,用于计算生存期PD。在做人生预测时:gydF4y2Ba

  • 可能使用不同的数据集,而不是您用于培训和验证的数据,而是具有用于不同贷款的前瞻性预测的新数据集。gydF4y2Ba

  • 生命周期预测数据集中的预测值跨越了几个时期,可能提前几年。gydF4y2Ba

加载gydF4y2Badatapredictlifetime.matgydF4y2Ba终身预测的数据。请注意,对于预测,您不需要通过响应数据,您只能通过预测器。您只通过临界或验证的响应值,而不是预测。gydF4y2Ba

负载gydF4y2Badatapredictlifetime.matgydF4y2BaLifetimeData =加入(LoanData MacroScenario);disp (LifetimeData)gydF4y2Ba
ID分数yob年GDP市场_________________ ________ ___________________1304“中等风险”4 2020 1.1 4.5 1304“中等风险”5 2021 0.9 1.5 1304“中等风险”6 2022 1.2 5 1304“中等风险”7 2023 1.4 5.5 1304“中等风险“8 2024 1.6 6 1304”中等风险“9 2025 1.8 6.5 1304”中等风险“10 2026 1.8 6.5 2067”低风险“7 2020 1.1 4.5 2067”低风险“8 2021 0.9 1.5 2067”低风险“9 20221.2 5 2067“低风险”10 2023 1.4 5.5gydF4y2Ba

这些行具有每年的数据,与用于训练的时间间隔一致。你可以在这两个gydF4y2Ba一年gydF4y2Ba变量和gydF4y2Bayob.gydF4y2Ba变量。在这个数据集中没有生命周期预测的标志。gydF4y2Ba

LifetimeData。PD=预测(pdmodel.,LifetimeData); LifetimeData.LifetimePD = predictLifetime(pdModel,LifetimeData)
LifetimeData =gydF4y2Ba11×8表gydF4y2BaID ScoreGroup小无赖PD LifetimePD GDP年市场  ____ _____________ ___ ____ ___ ______ __________ __________ 1304“中等风险”4 1304 2020 1.1 4.5 0.0081336 0.0081336“中等风险”1304 2021 0.9 1.5 0.0063861 0.014468“中等风险”6 2022 1.2 0.0047416 0.019141 1304“中等风险”7 2023 1.4 5.5 0.0028262 1.6 0.021913 1304“中等风险”8 20240.0014844 - 0.023365 1304“中等风险”9 2025 1.8 6.5 0.0014517 0.024783 1304“中等风险”2026 1.8 6.5 0.0014517 0.026198 2067“低风险”7 2020 1.1 4.5 0.0016091 0.0016091 2067“低风险”8 2021 0.9 1.5 0.0009006 0.0025082 2067“低风险”9 2022 1.2 2067 0.00085273 - 0.0033588“低风险”10 2023 1.4 5.5 0.00083391 0.0041899gydF4y2Ba

当行的周期性与训练数据中的周期性不匹配时,就不能正确地计算出生存期PD值。gydF4y2Ba

属性修改选定的行gydF4y2BaSelectedRowsgydF4y2Ba变量的行为gydF4y2BapredictLifetimegydF4y2Ba随着数据的周期性变化。(或者,gydF4y2Bayob.gydF4y2Ba可以手动修改值以输入年龄增量与1年的时间间隔不一致。)gydF4y2Ba

SelectedRows = 1:11;gydF4y2Ba%选择所有行1:11与上面的输出相同,没有警告gydF4y2BaLifetimedata2 = Lifetimedata(SecteningSrows,{gydF4y2Ba“ID”gydF4y2Ba,gydF4y2Ba“ScoreGroup”gydF4y2Ba,gydF4y2Ba“小无赖”gydF4y2Ba,gydF4y2Ba“年”gydF4y2Ba,gydF4y2Ba'gdp'gydF4y2Ba,gydF4y2Ba“市场”gydF4y2Ba});DISP(LIFETIMEDATA2)gydF4y2Ba
ID分数yob年GDP市场_________________ ________ ___________________1304“中等风险”4 2020 1.1 4.5 1304“中等风险”5 2021 0.9 1.5 1304“中等风险”6 2022 1.2 5 1304“中等风险”7 2023 1.4 5.5 1304“中等风险“8 2024 1.6 6 1304”中等风险“9 2025 1.8 6.5 1304”中等风险“10 2026 1.8 6.5 2067”低风险“7 2020 1.1 4.5 2067”低风险“8 2021 0.9 1.5 2067”低风险“9 20221.2 5 2067“低风险”10 2023 1.4 5.5gydF4y2Ba
lifetimedata2.pd =预测(pdmodel,lifetimedata2);lifetimedata2.lifetimepd = predictlifetime(pdmodel,lifetimedata2);DISP(LIFETIMEDATA2)gydF4y2Ba
ID ScoreGroup小无赖PD LifetimePD GDP年市场  ____ _____________ ___ ____ ___ ______ __________ __________ 1304“中等风险”4 1304 2020 1.1 4.5 0.0081336 0.0081336“中等风险”1304 2021 0.9 1.5 0.0063861 0.014468“中等风险”6 2022 1.2 0.0047416 0.019141 1304“中等风险”7 2023 1.4 5.5 0.0028262 1.6 0.021913 1304“中等风险”8 20240.0014844 - 0.023365 1304“中等风险”9 2025 1.8 6.5 0.0014517 0.024783 1304“中等风险”2026 1.8 6.5 0.0014517 0.026198 2067“低风险”7 2020 1.1 4.5 0.0016091 0.0016091 2067“低风险”8 2021 0.9 1.5 0.0009006 0.0025082 2067“低风险”9 2022 1.2 2067 0.00085273 - 0.0033588“低风险”10 2023 1.4 5.5 0.00083391 0.0041899gydF4y2Ba

行为上的差异取决于模型类型以及年龄变量是否属于模型的一部分。您可以在拟合步骤中更改模型类型,以查看不同模型类型的行为。删除年龄变量(gydF4y2BaAgeVargydF4y2Ba)gydF4y2Ba物流gydF4y2Ba和gydF4y2BaProbitgydF4y2Ba模型来观察当年龄输入参数不是模型的一部分时的行为。请注意年龄输入(gydF4y2BaAgeVargydF4y2Ba)参数是必需的gydF4y2Ba考克斯gydF4y2Ba模型。有关更多信息,请参见gydF4y2Ba用于寿命预测的数据输入gydF4y2Ba.gydF4y2Ba

输入参数gydF4y2Ba

全部折叠gydF4y2Ba

默认模型的概率,指定为先前创建的gydF4y2Ba物流gydF4y2Ba,gydF4y2BaProbitgydF4y2Ba, 或者gydF4y2Ba考克斯gydF4y2Ba对象使用gydF4y2Bafitlifetimepdmodel.gydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba对象gydF4y2Ba

生命周期数据,指定为gydF4y2BaNumRowsgydF4y2Ba-经过-gydF4y2BaNumColsgydF4y2Ba表与预计预测值值,以制定终身预测。预测器名称和数据类型必须与底层模型一致。的gydF4y2BaIDVargydF4y2Ba财产的财产gydF4y2Bapdmodel.gydF4y2Ba输入用于标识表中包含ID值的列,这些ID用于标识与不同ID对应的行,并对每个ID进行生存期预测。gydF4y2Ba

请注意gydF4y2Ba

  • 在生命周期预测数据中传递的行必须具有与用于适合模型的时间间隔相同的周期性。例如,如果用于培训的时间间隔为一年,则终身预测的数据输入不能有季度数据或每五年的数据。gydF4y2Ba

  • 相同ID的连续行gydF4y2Ba必须gydF4y2Ba对应连续的周期。例如,如果用于培训的时间间隔为一年,您无法跳过逾期并通过数据超过1,2,5和10的数据。gydF4y2Ba

有关更多信息,请参见gydF4y2Ba用于寿命预测的数据输入gydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba表格gydF4y2Ba

名称-值参数gydF4y2Ba

指定可选的逗号分隔的对gydF4y2Ba名称,值gydF4y2Ba论点。gydF4y2Ba姓名gydF4y2Ba参数名和gydF4y2Ba价值gydF4y2Ba为对应值。gydF4y2Ba姓名gydF4y2Ba必须出现在引号内。可以以任意顺序指定多个名称和值对参数gydF4y2Baname1,value1,...,namen,valuengydF4y2Ba.gydF4y2Ba

例子:gydF4y2BaLifetimeData = predictLifetime (pdModel、数据“ProbabilityType”、“生存”)gydF4y2Ba

概率类型,指定为逗号分隔对组成gydF4y2Ba'概率型'gydF4y2Ba和一个字符矢量或字符串。gydF4y2Ba

数据类型:gydF4y2BachargydF4y2Ba|gydF4y2Ba细绳gydF4y2Ba

输出参数gydF4y2Ba

全部折叠gydF4y2Ba

预测的生存期PD值,返回为gydF4y2BaNumRowsgydF4y2Ba-经过-gydF4y2Ba1gydF4y2Ba数值向量。gydF4y2Ba

更多关于gydF4y2Ba

全部折叠gydF4y2Ba

寿命PD.gydF4y2Ba

寿命PD.gydF4y2Ba是在金融资产的一生中默认事件的概率。gydF4y2Ba

寿命期PD通常是指累积违约概率,由gydF4y2Ba

PgydF4y2Ba DgydF4y2Ba cgydF4y2Ba ugydF4y2Ba 米gydF4y2Ba ugydF4y2Ba lgydF4y2Ba 一个gydF4y2Ba tgydF4y2Ba 我gydF4y2Ba vgydF4y2Ba egydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba =gydF4y2Ba PgydF4y2Ba {gydF4y2Ba TgydF4y2Ba ≤.gydF4y2Ba tgydF4y2Ba }gydF4y2Ba

在哪里gydF4y2BaTgydF4y2Ba是时候违约了。gydF4y2Ba

例如,预测的生存期,第二年的累积PD是借款人从现在到两年后任何时间违约的概率。gydF4y2Ba

用于计算终身期望信用损失(ECL)的密切相关概念是gydF4y2Ba边缘PDgydF4y2Ba,给予gydF4y2Ba

PgydF4y2Ba DgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba 我gydF4y2Ba ngydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba =gydF4y2Ba PgydF4y2Ba DgydF4y2Ba cgydF4y2Ba ugydF4y2Ba 米gydF4y2Ba ugydF4y2Ba lgydF4y2Ba 一个gydF4y2Ba tgydF4y2Ba 我gydF4y2Ba vgydF4y2Ba egydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba −gydF4y2Ba PgydF4y2Ba DgydF4y2Ba cgydF4y2Ba ugydF4y2Ba 米gydF4y2Ba ugydF4y2Ba lgydF4y2Ba 一个gydF4y2Ba tgydF4y2Ba 我gydF4y2Ba vgydF4y2Ba egydF4y2Ba (gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba

一个密切相关的概率是gydF4y2Ba生存概率gydF4y2Ba,这是累积概率的补充,并报告为gydF4y2Ba

年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba =gydF4y2Ba PgydF4y2Ba {gydF4y2Ba TgydF4y2Ba >gydF4y2Ba tgydF4y2Ba }gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba PgydF4y2Ba DgydF4y2Ba cgydF4y2Ba ugydF4y2Ba 米gydF4y2Ba ugydF4y2Ba lgydF4y2Ba 一个gydF4y2Ba tgydF4y2Ba 我gydF4y2Ba vgydF4y2Ba egydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba

条件pd与生存概率的关系递归公式如下:gydF4y2Ba

年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba 0gydF4y2Ba )gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba 1gydF4y2Ba )gydF4y2Ba =gydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba 0gydF4y2Ba )gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba PgydF4y2Ba DgydF4y2Ba (gydF4y2Ba tgydF4y2Ba 1gydF4y2Ba )gydF4y2Ba )gydF4y2Ba ......gydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba ngydF4y2Ba )gydF4y2Ba =gydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba ngydF4y2Ba −gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba PgydF4y2Ba DgydF4y2Ba (gydF4y2Ba tgydF4y2Ba ngydF4y2Ba )gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2BatgydF4y2Ba我gydF4y2Ba- - - - - -gydF4y2BatgydF4y2Ba我gydF4y2Ba1 =ΔgydF4y2BatgydF4y2Ba对所有人gydF4y2Ba我gydF4y2Ba= 1,......,gydF4y2BangydF4y2Ba,ΔgydF4y2BatgydF4y2Ba为拟合模型所用的时间间隔。有关更多信息,请参见gydF4y2BaLogistic模型的时间间隔gydF4y2Ba和gydF4y2Ba探测模型的时间间隔gydF4y2Ba.换句话说,因为公式的右侧的PD值是默认值Δ的概率Δ的概率gydF4y2BatgydF4y2Ba,递归中连续时间之间的增量必须始终是长度ΔgydF4y2BatgydF4y2Ba所有的时间gydF4y2Ba我gydF4y2Ba= 1,2,......,gydF4y2BangydF4y2Ba.gydF4y2Ba

的gydF4y2BapredictLifetimegydF4y2Ba函数调用的gydF4y2Ba预测gydF4y2Ba函数获取条件PD,然后使用前面的公式将其转换为生存、边缘或寿命累积PD。gydF4y2Ba

用于寿命预测的数据输入gydF4y2Ba

的gydF4y2Ba时间间隔gydF4y2Ba模型的拟合对寿命预测具有重要意义。gydF4y2Ba

的数据输入gydF4y2BapredictLifetimegydF4y2Ba是面板数据形式,每个ID有多行。每一行都有一个隐式或显式的时间戳,连续行之间的时间增量必须与用于拟合模型的时间间隔相同。有关时间间隔的更多信息,请参见gydF4y2Ba考克斯模型的时间间隔gydF4y2Ba,gydF4y2BaLogistic模型的时间间隔gydF4y2Ba,gydF4y2Ba探测模型的时间间隔gydF4y2Ba.gydF4y2Ba

遵循生命周期PD递归公式的表示法,如gydF4y2Ba寿命PD.gydF4y2Ba,时间戳gydF4y2BatgydF4y2Ba1gydF4y2Ba,gydF4y2BatgydF4y2Ba2gydF4y2Ba、……gydF4y2BatgydF4y2BangydF4y2Ba连续行之间必须满足gydF4y2BatgydF4y2Ba我gydF4y2Ba- - - - - -gydF4y2BatgydF4y2Ba我gydF4y2Ba-1gydF4y2Ba=ΔgydF4y2BatgydF4y2Ba对所有人gydF4y2Ba我gydF4y2Ba= 1,......,gydF4y2BangydF4y2Ba,ΔgydF4y2BatgydF4y2Ba为拟合模型所用的时间间隔。换句话说:gydF4y2Ba

  • 行通过了gydF4y2Ba数据gydF4y2Ba终身预测的输入必须具有与用于适合模型的时间间隔相同的周期性。例如,如果用于培训的时间间隔为1年,则gydF4y2Ba数据gydF4y2Ba终身预测的输入不能有季度数据或每5年的数据。gydF4y2Ba

  • 相同ID的连续行gydF4y2Ba必须gydF4y2Ba对应连续的周期。例如,如果用于培训的时间间隔是1年,则不能跳过年份,并传递第1、2、5和10年的数据。gydF4y2Ba

假设是具体性,时间间隔δgydF4y2BatgydF4y2Ba用来拟合模型的是1年。然后是公式右边的PD值gydF4y2Ba寿命PD.gydF4y2Ba1年期PDs。因此:gydF4y2Ba

  • 季度数据的寿命PD无法计算,因为s(gydF4y2Ba1.25gydF4y2Ba)≠s(gydF4y2Ba1gydF4y2Ba)(1−PD (gydF4y2Ba1.25gydF4y2Ba),因为PD (gydF4y2Ba1.25gydF4y2Ba)是一个1年的PD,它跨越了从gydF4y2Ba0.25gydF4y2Ba到gydF4y2Ba1.25gydF4y2Ba.gydF4y2Ba

  • 无法计算每5年数据的终身PD,因为S(gydF4y2Ba10.gydF4y2Ba)≠s(gydF4y2Ba5gydF4y2Ba)(1−PD (gydF4y2Ba10.gydF4y2Ba),因为PD (gydF4y2Ba10.gydF4y2Ba)是一个1年的PD,它跨越了从gydF4y2Ba9gydF4y2Ba到gydF4y2Ba10.gydF4y2Ba.gydF4y2Ba

  • 无法计算非连续行的寿命PD。例如,如果gydF4y2Ba数据gydF4y2Ba输入的行分别对应年份1、2、5和10,则S(gydF4y2Ba1gydF4y2Ba)和s(gydF4y2Ba2gydF4y2Ba)可以正确计算,但是s(gydF4y2Ba5gydF4y2Ba)≠s(gydF4y2Ba2gydF4y2Ba)(1−PD (gydF4y2Ba5gydF4y2Ba)因为PD (gydF4y2Ba5gydF4y2Ba)是一个1年的PD,它跨越了从gydF4y2Ba4gydF4y2Ba到gydF4y2Ba5gydF4y2Ba,同样对s(gydF4y2Ba10.gydF4y2Ba).gydF4y2Ba

的gydF4y2BapredictLifetimegydF4y2Ba函数调用的gydF4y2Ba预测gydF4y2Ba函数得到条件PD,然后利用上述公式将其转换为生存PD、边缘PD或寿命累积PD。gydF4y2Ba

验证生命周期预测的数据输入gydF4y2Ba

数据输入中行周期的验证gydF4y2BapredictLifetimegydF4y2Ba取决于模型类型(gydF4y2Bamodeltype.gydF4y2Ba),以及模型是否包含年龄变量(gydF4y2BaAgeVargydF4y2Ba).gydF4y2Ba

考克斯gydF4y2Ba模型可以验证数据的周期性,因为年龄变量(gydF4y2BaAgeVargydF4y2Ba)是必需的输入参数和gydF4y2Ba考克斯gydF4y2Ba模型存储时间间隔(gydF4y2Ba时间间隔gydF4y2Ba)用于符合模型。的gydF4y2Ba时间间隔gydF4y2Ba用于拟合模型并预测PD值。有关a的时间间隔的更多信息gydF4y2Ba考克斯gydF4y2Ba模型,参见gydF4y2Ba考克斯模型的时间间隔gydF4y2Ba.年龄变量(gydF4y2BaAgeVargydF4y2Ba)用作时间尺寸。对于每个ID,如果周期性gydF4y2Ba数据gydF4y2Ba输入,由年龄变量的增量测量,不匹配用于训练模型的时间间隔,显示一个警告,并填充生命周期PD值gydF4y2Ba南gydF4y2Ba年代。gydF4y2Ba

物流gydF4y2Ba和gydF4y2BaProbitgydF4y2Ba模型不存储时间间隔值。然而,预测的PD值仍然与训练数据中的(显式或隐式)时间间隔一致。有关更多信息,请参见gydF4y2BaLogistic模型的时间间隔gydF4y2Ba和gydF4y2Ba探测模型的时间间隔gydF4y2Ba.此外,对于gydF4y2Ba物流gydF4y2Ba和gydF4y2BaProbitgydF4y2Ba模型,年龄变量(gydF4y2BaAgeVargydF4y2Ba)是可选的,并且没有其他方法可以在模型中指定时间维度。因此:gydF4y2Ba

  • 如果gydF4y2Ba物流gydF4y2Ba或gydF4y2BaProbitgydF4y2Ba模型没有年龄变量信息,无法验证数据的周期性。使用递归计算寿命PDgydF4y2Ba寿命PD.gydF4y2Ba,假设周期性是正确的。调用者有责任确保数据行的周期性与培训中的时间间隔一致gydF4y2Ba数据gydF4y2Ba.gydF4y2Ba

  • 如果gydF4y2Ba物流gydF4y2Ba或gydF4y2BaProbitgydF4y2Ba模型有一个年龄变量(gydF4y2BaAgeVargydF4y2Ba),这被用作时间维度。但是,由于用于训练数据的时间间隔是未知的gydF4y2Ba物流gydF4y2Ba和gydF4y2BaProbitgydF4y2Ba模型,这些模型只能验证年龄增量是规则如下,但不能与参考时间间隔比较。gydF4y2Ba

    • 对于每个ID,当年龄显示不规则的年龄增量时,会出现一个警告,并将生存期PD值设置为gydF4y2Ba南gydF4y2Ba年代。gydF4y2Ba

    • 当每个ID中的年龄增量是常规时,但有些ID具有与其他ID的不同年龄增量,则显示警告,但它未知哪个ID具有错误的增量。使用递归计算终身PD值gydF4y2Ba寿命PD.gydF4y2Ba适用于所有ID。呼叫者有责任确保所有ID的数据行的周期性与培训中的时间间隔一致gydF4y2Ba数据gydF4y2Ba.gydF4y2Ba

例如,请参见gydF4y2Ba寿命预测和时间间隔gydF4y2Ba.gydF4y2Ba

参考gydF4y2Ba

[1]贝森斯,巴特,丹尼尔·罗施,哈拉尔德·舍勒。gydF4y2Ba信用风险分析:SAS中的测量技术,应用和示例。gydF4y2BaWiley,2016年。gydF4y2Ba

[2] Bellini,Tiziano。gydF4y2BaIFRS 9和CECL信用风险建模和验证:在R和SAS中工作的实例的实用指南。gydF4y2Ba圣地亚哥,加利福尼亚州:2019年elestvier。gydF4y2Ba

[3]布里登,约瑟夫。gydF4y2Ba与CECL一起生活:建模词典。gydF4y2Ba圣达菲,NM: Prescient Models LLC, 2018。gydF4y2Ba

Roesch Daniel Scheule和Harald Scheule。gydF4y2Ba深度信用风险:Python机器学习。gydF4y2Ba独立出版,2020年。gydF4y2Ba

介绍了R2020bgydF4y2Ba