带有ARIMA误差的回归模型的截距可识别性
截距可识别性
具有ARIMA误差的回归模型具有以下一般形式(t= 1,…,T)
(1) |
t= 1,…,T.
yt是响应级数。
Xt是行t的X,为预测器数据向量的拼接矩阵。也就是说,Xt是观察t每个预测序列。
c为回归模型截距。
β是回归系数。
ut是扰动级数。
εt就是创新系列。
也就是度p,非季节自回归多项式。
也就是度p年代,季节自回归多项式。
也就是度D,非季节积分多项式。
也就是度年代,季节积分多项式。
也就是度问,非季节性移动平均多项式。
也就是度问年代,季节移动平均多项式。
如果你指定了D=年代= 0(即不表示季节性或非季节性集成),则每个参数都是可识别的。换句话说,在给定数据的情况下,似然目标函数对参数的变化很敏感。
如果你指定了D> 0或年代> 0,你想估计截距,c,然后c不可识别。
你可以证明这是正确的。
考虑方程1.解出ut把它代入第一个方程。
在哪里
-
似然函数是基于的分布εt.解出εt.
请注意,ljc=c.常数项对似然的贡献如下。
或
因此,在对ARIMA误差模型进行积分时,基于分布的似然目标函数εt的值不变吗c.
一般来说,具有ARIMA误差的回归模型的等效armax表示中的有效常数是复合自回归系数和原始截距的函数c,并加入非线性约束。这种约束被无缝地整合到应用程序中,例如具有非零截距的集成模型的蒙特卡罗模拟。然而,对于估计,ARIMAX模型无法识别存在积分多项式的常数,这导致虚假或不寻常的参数估计。
在大多数应用程序中,您应该从集成模型中排除拦截。
拦截可识别性说明
举例来说,考虑没有预测因子的ARIMA(2,1,1)误差的回归模型
(2) |
(3) |
你可以重写方程3使用代换和一些操作
请注意,
因此,该回归模型具有ARIMA(2,1,1)误差方程3有一个ARIMA(2,1,1)模型表示
您可以看到,该常数在模型中不存在(这意味着它的值为0),即使具有ARIMA误差截距的回归模型的值为0.5。
您还可以模拟这种行为。首先指定带有ARIMA(2,1,1)误差的回归模型方程3.
Mdl0 = regARIMA(' D ', 1基于“增大化现实”技术的{0.8 - -0.4},“马”, 0.3,...“拦截”, 0.5,“方差”, 0.2);
模拟1000个观察结果。
rng (1);T = 1000;y =模拟(Mdl0, T);
适合Mdl
对数据。
Mdl = regARIMA(“ARLags”1:2,“MALags”, 1' D '1);...%“空”模型传递到估计中[EstMdl,EstParamCov] =估计(Mdl,y,“显示”,“参数”);
警告:集成ARIMA误差模型时,截距不可识别,无法估计;返回一个NaN。
ARIMA(2,1,1)误差模型(Gaussian分布):Value StandardError TStatistic PValue ________ _____________ __________ ___________ Intercept NaN NaN NaN NaN AR{1} 0.89647 0.048507 18.481 2.9207e-76 AR{2} -0.45102 0.038916 -11.59 4.6572e-31 MA{1} 0.18804 0.054505 3.4499 0.00056069 Variance 0.19789 0.0083512 23.696 3.9373e-124
估计
显示一个警告,通知您无法识别截获点,并设置其估计值、标准误差和t统计,南
.
绘制截距的轮廓可能性。
c = linspace(Mdl0。截距- 50,...Mdl0。截距+ 50,100);%网格拦截logL = nan(数字(c),1);预分配百分比为i = 1:数字(logL) EstMdl。截距= c(i);[~,~,~,logL(i)] = infer(EstMdl,y);结束图(c,logL)“与拦截有关的剖面对数可能性”)包含(“拦截”) ylabel (“Loglikelihood”)
对数似然在截距值的网格上不改变。轻微的振荡是一个数值程序的结果推断出
.