主要内容

带有ARIMA误差的回归模型的截距可识别性

截距可识别性

具有ARIMA误差的回归模型具有以下一般形式(t= 1,…,T

y t c + X t β + u t 一个 l 一个 l 1 l D 1 l 年代 u t b l B l ε t (1)
在哪里

  • t= 1,…,T

  • yt是响应级数。

  • Xt是行tX,为预测器数据向量的拼接矩阵。也就是说,Xt是观察t每个预测序列。

  • c为回归模型截距。

  • β是回归系数。

  • ut是扰动级数。

  • εt就是创新系列。

  • l j y t y t j

  • 一个 l 1 一个 1 l ... 一个 p l p 也就是度p,非季节自回归多项式。

  • 一个 l 1 一个 1 l ... 一个 p 年代 l p 年代 也就是度p年代,季节自回归多项式。

  • 1 l D 也就是度D,非季节积分多项式。

  • 1 l 年代 也就是度年代,季节积分多项式。

  • b l 1 + b 1 l + ... + b l 也就是度,非季节性移动平均多项式。

  • B l 1 + B 1 l + ... + B 年代 l 年代 也就是度年代,季节移动平均多项式。

  • 如果你指定了D年代= 0(即不表示季节性或非季节性集成),则每个参数都是可识别的。换句话说,在给定数据的情况下,似然目标函数对参数的变化很敏感。

  • 如果你指定了D> 0或年代> 0,你想估计截距,c,然后c不可识别。

你可以证明这是正确的。

  • 考虑方程1.解出ut把它代入第一个方程。

    y t c + X t β + Η 1 l Ν l ε t

    在哪里

    • Η l 一个 l 1 l D 一个 l 1 l 年代

    • Ν l b l B l

  • 似然函数是基于的分布εt.解出εt

    ε t Ν 1 l Η l y t + Ν 1 l Η l c + Ν 1 l Η l X t β

  • 请注意,ljcc.常数项对似然的贡献如下。

    Ν 1 l Η l c Ν 1 l 一个 l 一个 l 1 l D 1 l 年代 c Ν 1 l 一个 l 一个 l 1 l D c c 0

    Ν 1 l Η l c Ν 1 l 一个 l 一个 l 1 l 年代 1 l D c Ν 1 l 一个 l 一个 l 1 l 年代 1 l D 1 1 l c Ν 1 l 一个 l 一个 l 1 l 年代 1 l D 1 c c 0.

因此,在对ARIMA误差模型进行积分时,基于分布的似然目标函数εt的值不变吗c

一般来说,具有ARIMA误差的回归模型的等效armax表示中的有效常数是复合自回归系数和原始截距的函数c,并加入非线性约束。这种约束被无缝地整合到应用程序中,例如具有非零截距的集成模型的蒙特卡罗模拟。然而,对于估计,ARIMAX模型无法识别存在积分多项式的常数,这导致虚假或不寻常的参数估计。

在大多数应用程序中,您应该从集成模型中排除拦截。

拦截可识别性说明

举例来说,考虑没有预测因子的ARIMA(2,1,1)误差的回归模型

y t 0.5 + u t 1 0.8 l + 0.4 l 2 1 l u t 1 + 0.3 l ε t (2)
y t 0.5 + u t 1 1.8 l + 1.2 l 2 0.4 l 3. u t 1 + 0.3 l ε t (3)

你可以重写方程3使用代换和一些操作

y t 1 1.8 + 1.2 0.4 0.5 + 1.8 y t 1 1.2 y t 2 + 0.4 y t 3. + ε t + 0.3 ε t 1

请注意,

1 1.8 + 1.2 0.4 0.5 0 0.5 0.

因此,该回归模型具有ARIMA(2,1,1)误差方程3有一个ARIMA(2,1,1)模型表示

y t 1.8 y t 1 1.2 y t 2 + 0.4 y t 3. + ε t + 0.3 ε t 1

您可以看到,该常数在模型中不存在(这意味着它的值为0),即使具有ARIMA误差截距的回归模型的值为0.5。

您还可以模拟这种行为。首先指定带有ARIMA(2,1,1)误差的回归模型方程3

Mdl0 = regARIMA(' D ', 1基于“增大化现实”技术的{0.8 - -0.4},“马”, 0.3,...“拦截”, 0.5,“方差”, 0.2);

模拟1000个观察结果。

rng (1);T = 1000;y =模拟(Mdl0, T);

适合Mdl对数据。

Mdl = regARIMA(“ARLags”1:2,“MALags”, 1' D '1);...%“空”模型传递到估计中[EstMdl,EstParamCov] =估计(Mdl,y,“显示”“参数”);
警告:集成ARIMA误差模型时,截距不可识别,无法估计;返回一个NaN。
ARIMA(2,1,1)误差模型(Gaussian分布):Value StandardError TStatistic PValue ________ _____________ __________ ___________ Intercept NaN NaN NaN NaN AR{1} 0.89647 0.048507 18.481 2.9207e-76 AR{2} -0.45102 0.038916 -11.59 4.6572e-31 MA{1} 0.18804 0.054505 3.4499 0.00056069 Variance 0.19789 0.0083512 23.696 3.9373e-124

估计显示一个警告,通知您无法识别截获点,并设置其估计值、标准误差和t统计,

绘制截距的轮廓可能性。

c = linspace(Mdl0。截距- 50,...Mdl0。截距+ 50,100);%网格拦截logL = nan(数字(c),1);预分配百分比i = 1:数字(logL) EstMdl。截距= c(i);[~,~,~,logL(i)] = infer(EstMdl,y);结束图(c,logL)“与拦截有关的剖面对数可能性”)包含(“拦截”) ylabel (“Loglikelihood”

图中包含一个轴对象。标题为Profile Log-Likelihood with The Intercept的axes对象包含一个line类型的对象。

对数似然在截距值的网格上不改变。轻微的振荡是一个数值程序的结果推断出

相关的话题