主要内容

艾比克

信息标准

描述

为了评估模型的充分性,艾比克计算信息标准通过将竞争模型与数据拟合得到的对数似然值。

例子

艾克=aicbic(对数纽帕兰返回给定对数似然值的Akaike信息标准(AIC)对数推导出不同模型对数据的拟合,并给出相应数量的估计模型参数纽帕兰

例子

艾克bic]=aicbic(对数纽帕兰暴民也返回贝叶斯(施瓦茨)信息标准(BIC)给出相应的样本大小用于估计暴民

例子

艾克bic]=aicbic(对数纽帕兰暴民,“正常化”,为真)通过将所有输出参数除以样本大小来规范化结果暴民.默认情况下,艾比克不将结果标准化(“正常化”,假的).

例子

艾克bic集成电路]=aicbic(对数纽帕兰暴民也返回结构集成电路包含AIC、BIC和其他信息标准

艾克bic集成电路]=aicbic(对数纽帕兰暴民,“正常化”,为真)按样本大小规范化所有返回的信息条件暴民

例子

全部崩溃

使用AIC和BIC比较三个竞争模型的样本内拟合。loglikelihood价值对数和相应的估计参数个数纽帕兰如下表所示。假设有效样本量为1500。

logL=[-681.4724;-663.4615;-632.3158];numParam=[12;18;27];numObs=1500;Tbl=table(logL,numParam,“RowNames”“模型”+弦(1:3))
台=3×2表logL numParam _______ ________ Model1 -681.47 12 Model2 -663.46 18 Model3 -632.32 27

计算AIC

计算每个估计模型的AIC。

aic = aicbic (logL numParam)
aic =3×1103.× 1.3869 1.3629 1.3186

AIC最低的模型具有最好的样本内拟合。识别AIC最低的模型。

[~, idxmin] = min (aic);bestFitAIC = Tbl.Properties.RowNames {idxmin}
bestFitAIC='Model3'

AIC认为Model3尽管是三款车型中最复杂的一款,但它的契合度是最好、最简约的。

计算BIC

计算每个估计模型的BIC。指定样本量暴民,这是计算BIC所必需的。

[~,bic]=aicbic(logL,numParam,numObs)
bic =3×1103.× 1.4507 1.4586 1.4621

与AIC的情况一样,BIC最低的模型具有最佳的样本拟合。识别BIC最低的模型。

[~, idxmin] = min (bic);bestFitBIC = Tbl.Properties.RowNames {idxmin}
bestFitBIC='Model1'

BIC建议Model1这是三种模型中最简单的一种。结果表明,当样本量较大时,BIC比AIC对复杂模型的影响更大。

将多个模型与模拟数据拟合,然后使用所有可用信息标准比较模型拟合。

从数据生成过程(DGP)中模拟长度为100的随机路径

y t 1 + 0 2 y t - 1 - 0 4 y t - 2 + ε t

哪里 ε t 是均值为0,方差为1的随机高斯序列。

rng(1)%的再现性T=100;DGP=arima(“常数”,1,基于“增大化现实”技术的[0.2, -0.4],“差异”1);y =模拟(文章、T);

假设DGP未知,AR(1)、AR(2)和AR(3)模型适合描述DGP。

对于每个竞争模型,创建一个华宇电脑用于估计的模型模板。

Mdl (1) = arima (1,0,0);Mdl (2) = arima (2 0 0);Mdl (3) = arima (0, 0);

将每个模型与模拟数据拟合y,计算对数似然,并抑制估计显示。

numMdl=numel(Mdl);logL=0(numMdl,1);% PreallocatenumParam=零(numMdl,1);1:numMdl [EstMdl,~,logL(j)] =估计(Mdl(j),y,“显示”“关闭”);结果=总结(EstMdl);numParam (j) = results.NumEstimatedParameters;结束

对于每个模型,计算所有可用的信息标准。

(~, ~, ic) = aicbic (logL numParam T)
集成电路=带字段的结构:Aic: [310.9968 285.5082 287.0309] bic: [318.8123 295.9289 300.0567] aicc: [311.2468 285.9292 287.6692] caic: [321.8123 299.9289 305.0567] hqc: [314.1599 289.7256 292.3027]

集成电路是一个一维结构数组,每个信息标准有一个字段。每个字段包含一个测量向量;元素j对应于产生对数似然的模型对数(j

对于每个标准,确定产生最小值的模型。

[~, minIdx] = structfun (@min、ic);(Mdl (minIdx)。描述]“
ans =5x1字符串“ARIMA(2,0,0)模型(高斯分布)”“ARIMA(2,0,0)模型(高斯分布)”“ARIMA(2,0,0)模型(高斯分布)”“ARIMA(2,0,0)模型(高斯分布)”“ARIMA(2,0,0)模型(高斯分布)”

每个准则的最小值对应AR(2)模型,该模型具有DGP的结构。

将几个模型拟合到模拟数据中,指定一个预样本进行估计,然后使用归一化AIC对拟合的模型进行比较。

从DGP模拟长度为50的随机路径

y t 1 + 0 2 y t - 1 - 0 4 y t - 2 + ε t

哪里 ε t 是均值为0,方差为1的随机高斯序列。

rng(1)%的再现性T = 50;文章= arima (“常数”,1,基于“增大化现实”技术的[0.2, -0.4],“差异”1);y =模拟(文章、T);

创建一个华宇电脑每个竞争模型的模型模板。

Mdl (1) = arima (1,0,0);Mdl (2) = arima (2 0 0);Mdl (3) = arima (0, 0);

将每个模型与模拟数据拟合y,并为每次拟合指定所需的采样前观测数。计算对数似然,并抑制估计显示。

numMdl=numel(Mdl);logL=0(numMdl,1);% PreallocatenumParam=0(numMdl,1);numObs=0(numMdl,1);j=1:nummdly0=y(1:Mdl(j).P);%预采样yest=y((Mdl(j.P+1):结束);%估计样本[EstMdl, ~, logL (j)] =估计(Mdl (j),是的,“Y0”, y0,...“显示”“关闭”);结果=总结(EstMdl);numParam (j) = results.NumEstimatedParameters;numObs (j) = results.SampleSize;结束

对于每个模型,计算归一化AIC。

aic=aicbic(对数、对数、对数),“正常化”,对)
aic =3×13.2972 2.9880 3.0361

确定产生最小AIC的模型。

[~,minIdx]=min(aic);Mdl(minIdx).说明
ans = "ARIMA(2,0,0)模型(高斯分布)"

输入参数

全部崩溃

与不同模型的参数估计相关的对数似然数,指定为数值向量。

数据类型:

模型中估计参数的数目,指定为适用于的所有元素的正整数对数,或长度与对数

数据类型:

用于估计的样本大小,指定为适用于的所有元素的正整数对数,或长度与对数

艾比克需要暴民适用于除AIC以外的所有标准。艾比克还需要暴民如果“正常化”符合事实的

数据类型:

输出参数

全部崩溃

对应于对数,作为数字向量返回。

对应于对数,作为数字向量返回。

信息标准,作为包含本表中描述的字段的1-D结构数组返回。字段值是数值向量,其元素对应于的元素对数

描述
艾克 另类投资会议
bic BIC
aicc 修正的AIC(AICc)
caic 一致的AIC (CAIC)
认证机构 汉南·奎因标准(HQC)

ic.aicic.bic中是否返回相同的值艾克bic,分别。

更多关于

全部崩溃

信息标准

信息标准等级模型使用的措施,以平衡拟合优度与参数简约性。对于一个特定的标准,具有较低值的模型是首选。

此表描述了如何艾比克计算未规范化的条件。

信息标准 公式
另类投资会议 aic = -2*logL + 2*numParam
BIC bic=-2*logL+log(numObs)*numParam
AICc aicc=aic+[2*numParam*(numParam+1)]/(numObs-numParam-1)
CAIC caic = -2*logL + (log(nummobs) + 1)*numParam . caic = -2*logL + (log(nummobs) + 1
认证机构 hqc=-2*logL+2*log(log(numObs))*numParam

错误指定测试,如拉格朗日乘数(航空航天),似然比(lratiotest)和沃尔德(waldtest)测试,比较两个相互竞争的嵌套模型的对数似然。相比之下,基于个体模型拟合的对数似然信息标准是相对于DGP的信息损失的近似度量。信息标准提供了任意数量的竞争模型(包括非嵌套模型)的相对排名。

提示

  • 在小样本中,AIC倾向于过拟合。为了解决过拟合问题,AICc增加了一个尺寸依赖的校正项,增加了对参数数量的惩罚。AIC与AIC渐近。的分析[3]建议使用AICcnumObs / numParam<40

  • 当计量经济学家比较具有不同自回归滞后数或不同差分阶数的模型时,他们通常根据观测值的数量来衡量信息标准[5].要缩放信息标准,请设置暴民到每个估计的有效样本量,并集“正常化”这是真的。

参考文献

[1]Akaike Hirotugu。信息理论和极大似然原理的扩展在赤池弘图文集,伊曼纽尔·帕森、田边邦夫和北川源四郎编辑,199-213。纽约:施普林格,1998。https://doi.org/10.1007/978-1-4612-1694-0_15

[2]Akaike Hirotugu。《统计模型识别的新视角》。自动控制学报19,第6号(1974年12月):716-23。https://doi.org/10.1109/TAC.1974.1100705

[3]伯纳姆、肯尼斯·P.和大卫·R·安德森。模型选择和多模态推理:一种实用的信息论方法.第二版,纽约:施普林格,2002。

[4]汉南,爱德华·J和巴里·g·奎恩。"确定自回归的顺序"英国皇家统计学会杂志:B辑(方法学)41,第2号(1979年1月):190-95。https://doi.org/10.1111/j.2517-6161.1979.tb01072.x

[5]Lütkepohl, Helmut和Markus Krätzig,编辑。应用时间序列计量经济学剑桥大学出版社,2004年第1版。https://doi.org/10.1017/CBO9780511606885

[6]估计模型的尺寸统计年鉴6,第2号(1978年3月):461-64。https://doi.org/10.1214/aos/1176344136

在R2006a之前引入