主要内容

aicbic

信息标准

描述

为了评估模型的充分性,aicbic计算信息标准给出通过拟合竞争模型得到的对数似然值。

例子

另类投资会议= aicbic (logLnumParam返回给定对数似然值的赤池信息准则(AIC)logL由拟合不同的模型得到数据,并给出相应数量的估计模型参数numParam

例子

另类投资会议bic= aicbic(logLnumParamnumObs还返回给定用于估计的相应样本量的贝叶斯(施瓦茨)信息准则(BIC)numObs

例子

另类投资会议bic= aicbic(logLnumParamnumObs正常化= true)通过将所有输出参数除以样本大小来规范化结果numObs.默认情况下,aicbic不将结果规范化(= false正常化).

例子

另类投资会议bic集成电路= aicbic(logLnumParamnumObs也返回结构集成电路包含AIC, BIC和其他信息标准

另类投资会议bic集成电路= aicbic(logLnumParamnumObs正常化= true)根据样本大小将所有返回的信息标准归一化numObs

例子

全部折叠

使用AIC和BIC比较三个竞争模型的样本拟合。它们的对数似然值logL和相应的估计参数数numParam在下表中。假设有效样本量是1500。

logL = [-681.4724;-663.4615;-632.3158);numParam = [12;18;27];numObs = 1500;Tbl = table(logL,numParam,RowNames=“模型”+字符串(1:3)
台=3×2表logL numParam _______ ________ Model1 -681.47 12 Model2 -663.46 18 Model3 -632.32 27

计算AIC

计算每个估计模型的AIC。

aic = aicbic(logL,numParam)
aic =3×1103.× 1.3869 1.3629

AIC值最低的模型具有最好的样本内拟合。确定AIC最低的模型。

[~,idxmin] = min(aic);bestFitAIC = Tbl.Properties.RowNames{idxmin}
bestFitAIC = 'Model3'

AIC认为Model3尽管是三种型号中最复杂的一款,但它的合身度最高。

计算BIC

计算每个估计模型的BIC。指定样本量numObs,以计算BIC。

[~,bic] = aicbic(logL,numParam,numObs)
bic =3×1103.× 1.4507 1.4586

与AIC的情况一样,具有最低BIC的模型具有最佳的样本内拟合。确定BIC最低的型号。

[~,idxmin] = min(bic);bestFitBIC = Tbl.Properties.RowNames{idxmin}
bestFitBIC = 'Model1'

BIC建议Model1这是三个模型中最简单的一个。结果表明,当样本量较大时,BIC对复杂模型的惩罚大于AIC。

拟合几个模型模拟数据,然后比较模型拟合使用所有可用的信息标准。

从数据生成过程(DGP)中模拟一个长度为100的随机路径

y t 1 + 0 2 y t - 1 - 0 4 y t - 2 + ε t

在哪里 ε t 是均值为0,方差为1的随机高斯序列。

rng (1)%用于再现性T = 100;DGP = arima(常数=1,AR=[0.2 -0.4],方差=1);y =模拟(DGP,T);

假设DGP是未知的,并且AR(1), AR(2)和AR(3)模型适合描述DGP。

对于每个竞争模型,创建一个华宇电脑用于估计的模型模板。

Mdl(1) = arima(1,0,0);Mdl(2) = arima(2,0,0);Mdl(3) = arima(3,0,0);

使每个模型与模拟数据相匹配y,计算对数似然,并抑制估计显示。

numMdl = numel(Mdl);logL = 0 (numMdl,1);% PreallocatenumParam = 0 (numMdl,1);j = 1:numMdl [EstMdl,~,logL(j)] =估计(Mdl(j),y,显示=“关闭”);结果= summary (EstMdl);numParam(j) = results.NumEstimatedParameters;结束

对于每个模型,计算所有可用的信息标准。

[~,~,ic] = aicbic(logL,numParam,T)
ic =带字段的结构:Aic: [310.9968 285.5082 287.0309] bic: [318.8123 295.9289 300.0567] aicc: [311.2468 285.9292 287.6692] caic: [321.8123 299.9289 305.0567] hqc: [314.1599 289.7256 292.3027]

集成电路是一个一维结构数组,每个信息条件都有一个字段。每个字段包含一个测量向量;元素j对应于产生对数似然的模型logL (j

对于每个准则,确定产生最小值的模型。

[~,minIdx] = structfun(@min,ic);(Mdl (minIdx)。描述]“
ans =5 x1字符串ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)

每个准则的最小值对应于AR(2)模型,该模型具有DGP的结构。

对模拟数据拟合多个模型,指定预样本进行估计,然后使用标准化AIC比较模型拟合情况。

从DGP中模拟一个长度为50的随机路径

y t 1 + 0 2 y t - 1 - 0 4 y t - 2 + ε t

在哪里 ε t 是均值为0,方差为1的随机高斯序列。

rng (1)%用于再现性T = 50;DGP = arima(常数=1,AR=[0.2 -0.4],方差=1);y =模拟(DGP,T);

创建一个华宇电脑每个竞争模型的模型模板。

Mdl(1) = arima(1,0,0);Mdl(2) = arima(2,0,0);Mdl(3) = arima(3,0,0);

使每个模型与模拟数据相匹配y,并指定每个拟合所需的预样观测数。计算对数似然,并抑制估计显示。

numMdl = numel(Mdl);logL = 0 (numMdl,1);% PreallocatenumParam = 0 (numMdl,1);nummobs = 0 (numMdl,1);j = 1:numMdl y = y(1:Mdl(j).P);% Presampleyest = y((Mdl(j).P+1):end);估计样本[EstMdl,~,logL(j)] =估计(Mdl(j), Y0= Y0,...显示=“关闭”);结果= summary (EstMdl);numParam(j) = results.NumEstimatedParameters;numObs(j) = results.SampleSize;结束

对于每个模型,计算归一化AIC。

aic = aicbic(logL,numParam,numObs,Normalize=true)
aic =3×13.2972 2.9880 3.0361

确定产生最小AIC的模型。

[~,minIdx] = min(aic);Mdl (minIdx)。描述
ans = "ARIMA(2,0,0)模型(高斯分布)"

输入参数

全部折叠

与不同模型的参数估计相关的对数可能性,指定为数值向量。

数据类型:

模型中估计参数的数目,指定为应用于的所有元素的正整数logL,或长度相同的正整数向量logL

数据类型:

用于估计的样本大小,指定为应用于的所有元素的正整数logL,或长度相同的正整数向量logL

aicbic需要numObs除AIC外的所有标准。aicbic还需要numObs如果“正常化”真正的

数据类型:

输出参数

全部折叠

对应元素的AIClogL,作为数字向量返回。

对应的元素BIClogL,作为数字向量返回。

信息条件,作为包含本表中描述的字段的1-D结构数组返回。字段值是数值向量,其元素对应于的元素logL

描述
另类投资会议 另类投资会议
bic BIC
aicc 修正AIC (AICc)
中安集团经贸 一致AIC (CAIC)
认证机构 汉南-奎因标准

ic.aic而且ic.bic返回的值是否相同另类投资会议而且bic,分别。

更多关于

全部折叠

信息标准

信息标准使用平衡拟合优度和参数简约性的度量对模型进行排序。对于特定的准则,较低值的模型是首选。

下表描述了如何aicbic计算非标准化标准。

信息标准 公式
另类投资会议 aic = -2*logL + 2*numParam
BIC bic = -2*logL + log(nummobs)*numParam
AICc aicc = aic + [2*numParam*(numParam + 1)]/(nummobs - numParam - 1)
中安集团经贸 caic = -2*logL + (log(numObs) + 1)*numParam
认证机构 hqc = -2*logL + 2*log(log(numObs))*numParam

错误规范测试,例如拉格朗日乘法器(航空航天),似然比(lratiotest)和Wald (waldtest)测试,比较两个相互竞争的嵌套模型的对数可能性。相比之下,基于单个模型拟合的对数似然的信息准则是相对于DGP的信息损失的近似度量。信息标准提供了任意数量的竞争模型(包括非嵌套模型)的相对排名。

提示

  • 在小样本中,AIC倾向于过拟合。为了解决过拟合问题,AICc增加了一个依赖于尺寸的校正项,增加了对参数数量的惩罚。AICc渐近接近AIC。的分析[3]建议使用AICcnumObs / numParam<40

  • 当计量经济学家比较具有不同数量的自回归滞后或不同阶差的模型时,他们通常根据观察数来缩放信息标准[5].要扩展信息标准,请设置numObs对各有效样本量进行估计,并集“正常化”为true。

参考文献

[1]Akaike Hirotugu。"信息论和最大似然原理的推广"在赤池博途论文选集,由伊曼纽尔·帕岑、田边邦夫和北川健四郎编辑,199-213。纽约:施普林格,1998。https://doi.org/10.1007/978-1-4612-1694-0_15

[2]Akaike Hirotugu。《统计模型识别的新观点》IEEE自动控制汇刊19日,没有。6(1974年12月):716-23。https://doi.org/10.1109/TAC.1974.1100705

[3]伯纳姆,肯尼斯·P·和大卫·r·安德森。模型选择与多模型推断:一种实用的信息理论方法.第二版,纽约:施普林格,2002年。

[4]汉南,爱德华·J·和巴里·g·奎恩。"自回归顺序的确定"皇家统计学会学报:B辑(方法学)41岁的没有。2(1979年1月):190-95。https://doi.org/10.1111/j.2517-6161.1979.tb01072.x

[5]Lütkepohl, Helmut和Markus Krätzig,编辑。应用时间序列计量经济学.剑桥大学出版社,2004年第1版。https://doi.org/10.1017/CBO9780511606885

[6]施瓦兹,吉迪恩。"估计模型的维度"统计年鉴6,不。2(1978年3月):461-64。https://doi.org/10.1214/aos/1176344136

版本历史

R2006a之前介绍