时间序列回归X：广义最小二乘和HAC估计

打开生活的脚本

这个例子展示了如何在异方差或自相关(非球形)创新存在的情况下估计时间序列数据的多元线性回归模型。这是关于时间序列回归的一系列例子中的第10个，在前面例子的介绍之后。

介绍

多元线性回归模型通常被指定为异方差或自相关(非球形)的创新过程。如果经典线性模型(CLM)的其他正则性条件继续成立(见示例)时间序列回归I:线性模型)，一般最小二乘(OLS)估计的回归系数保持无偏，一致，并且，如果创新是正态分布，渐近正态。然而，相对于其他估计器，估计不再有效 $T$ 和 $F$ 检验不再有效，甚至渐近地，因为估计方差的标准公式变得有偏。因此，OLS系数估计的重要性被扭曲了(见示例)时间序列回归VI:残留诊断）.

对于这种情况，通常的方法是重新指定模型，选择替代预测因子以最小化残差中的非球面特征。然而，这并不总是实际的。预测器通常是根据理论、政策或可用数据来选择的，可选择的方法可能是有限的。用于解释自相关性的滞后预测器引入了额外的问题(见示例)时间序列回归VIII:滞后变量和估计偏差）.这个例子探讨了两种承认非球形存在的方法，并相应地修正了OLS估计程序。

第一种方法是使用OLS标准误差的异方差和自相关一致性（HAC）估计。OLS系数估计不变，但其显著性检验变得更加可靠。各种类型的HAC估计由计量经济学工具箱函数实现醋酸．

第二种方法修改OLS系数估计，通过显式合并关于新息协方差矩阵的信息，新息协方差矩阵的形式比 $σ^{2.} 我$ 。这被称为广义最小二乘（GLS），对于任何形式的已知协方差矩阵，它由统计和机器学习工具箱实现™ 作用lscov．不幸的是，创新协方差矩阵的形式在实践中很少为人所知。计量经济学工具箱功能fgls实施可行的广义最小二乘（FGLS）程序，在应用GLS获得回归系数及其标准误差之前，使用指定的模型估计新息协方差矩阵。

非球形创新

为了证明这一点，我们模拟了一个具有已知回归系数(1,2,3,4)的数据生成过程(DGP)，并与一个已知的非球形创新过程配对。作为典型的计量经济学模型，创新包括一定程度的异方差和自相关。回归分析的目的是从模拟数据中尽可能准确地恢复系数。

%模拟数据:numObs=50；%观测次数rng (0);重置随机数生成器X = randn (numObs 3);%3个随机预测因子%模拟创新:var=0.1；φ=[0.5,0.3]；%自相关系数e =模拟(arima (“不变”0,“AR”φ,“方差”，var），numObs）；e=X（：，1）。*e；%异方差与第一预测因子成正比%模拟响应：b=[1；2；3；4]；%回归系数，包括截距y=[one（numObs，1），X]*b+e；%存储数据:DataTable = array2table ((X, y),“变化无常”，{X1的,“X2”,“X3”,“Y”});

模拟中的预测器不是外生的模型，因为创新被指定为第一个预测器和一个AR(2)过程的产品。这保持了预测因子和创新之间的非相关(它们之间没有线性关系)，但方差是相关的。

OLS估计

首先，我们使用基于CLM假设的OLS公式估计系数和标准误差:

OLSModel = fitlm(数据表)

OLSModel =线性回归模型:Y ~ 1 + X1 + X2 + X3估计系数:估计SE tStat pValue  ________ ________ ______ __________ ( 拦截)1.016 0.05289 19.21 1.3187 e-23 X1 1.9171 0.041097 46.649 2.1891 e-40 X2 e-45 X3 4.022 2.0541 3.0239 0.050195 60.243 0.047813 84.12 5.044 e-52观测数量:50,错误自由度:46均方根误差:0.359 r平方:0.997，校正r平方:0.996 F-statistic vs. constant model: 4.38e+03, p-value = 1.62 -56

OLS估计近似的系数在DGP，和 $T$ 统计数据似乎非常显著。

然而，残差序列同时显示异方差和自相关（仅在模拟中，可以直接与创新进行比较）：

res = OLSModel.Residuals.Raw;图保存在情节(e,“bo - - - - - -”,“线宽”2)图(res,“莫-”,“线宽”，2）保持从传奇({“创新”,“OLS残差”})标题(“{\bf非球形创新}”网格)在

图中包含一个轴对象。标题为空白的轴对象包含2个类型为line的对象。这些对象代表创新，OLS残差。

HAC估计

HAC估计值的设计是为了纠正非球面创新引入的OLS标准误差计算中的偏差，从而为OLS系数的显著性推断提供更稳健的设置。HAC估计的一个优点是，它们不需要关于创新的异方差或自相关性质的详细知识，就可以计算出标准误差的一致估计。

HAC估计使用二次谱(QS)核达到最优的一致性率［1］:

hac(数据表,“重量”,“QS”,“显示”,“全部”)；

估计量类型:HAC估计方法:QS带宽:2.9266白化阶数:0有效样本量:50小样本量校正:on Coefficient Estimation: | Coeff SE ------------------------ Const | 1.0160 0.0466 X1 | 1.9171 0.0628 X2 | 3.0239 0.0569 X3 | 4.0220 0.0296|常量(X1, X2) X3  -------------------------------------------- Const X1 | | 0.0022 0.0007 -0.0005 -0.0004 0.0007 0.0039 -0.0011 -0.0002 X2 X3 | | -0.0005 -0.0011 0.0032 0.0004 -0.0004 -0.0002 0.0004 0.0009

标准误差的大小，以及OLS系数估计的可靠性，相对于上述OLS计算会发生变化。尽管经济数据中典型的正自相关往往会在OLS标准误差中产生向下的偏差，但在有限样本中，这种影响可能会因异方差的存在而被掩盖，一些标准误差在HAC估计中增加，而另一些则减少。

模型中有许多异方差和自相关模型醋酸框架。全面分析系数标准误差的可靠性将涉及使用多个模型，并对相关参数进行不同设置。例如，参见，［1］．

［1］建议对HAC进行预美白评估以减少偏差。该方法有增大估计量方差和均方误差的趋势，但可以提高置信区间覆盖概率，减少过拒 $T$ 统计数据。该过程是通过“变白”参数的醋酸，但它涉及一个“妨害参数”(VAR模型的顺序)，必须对其进行敏感性调查:

对于order = 0:3 [~，se] = hac(数据表，“重量”,“QS”,“变白”顺序“显示”,“关闭”)结束

se =4×10.0466 0.0628 0.0569 0.0296

se =4×10.0553 0.0801 0.0612 0.0347

se =4×10.1082 0.1486 0.1795 0.0390

se =4×10.1153 0.1337 0.1827 0.0361

0阶模型绕过预白化滤波器，以提供与以前相同的结果。不同白化阶下标准误差间隔的扩大和收紧说明了调整和解释过程的实际困难。

备受估计

HAC估计器的另一种选择是FGLS估计器(也称为Estimated GLS，或EGLS，估计器)，用于回归系数和它们的标准误差。这些估计量使用了修正公式，明确地包含了创新协方差矩阵。在实践中，使用FGLS估计的困难在于提供协方差的准确估计。同样，使用了各种模型，并从残差序列进行估计，但数值敏感性常常带来挑战。

确定合适的协方差模型的第一步是检验初始OLS回归的残差序列。示例中提供了这种类型的分析时间序列回归VI:残留诊断.基于原始残差图中明显的异方差性，如上所述，对角线协方差模型，如“HC1”选择“innovModel”参数在fgls，是一个合理的选择：

fgls（数据表，“innovMdl”,“HC1”,“显示”,“最后一次”)；

| Coeff SE ------------------------ Const | 1.0160 0.0529 X1 | 1.9171 0.0411 X2 | 3.0239 0.0502 X3 | 4.0220 0.0478 FGLS估计:| Coeff SE ------------------------ Const | 1.0117 0.0068 X1 | 1.9166 0.0062 X2 | 3.0256 0.0072 X3 | 4.0170 0.0067

系数估计与OLS相似，但标准误差显著降低。

为了考虑残差中自相关的影响，并为AR模型的协方差确定适当的滞后阶数，自相关图是有用的：

图子地块（2,1,1）自相关（res）子地块（2,1,2）地块（res）

图中包含2个轴对象。标题为样本自相关函数的轴对象1包含4个类型为stem, line的对象。标题为样本部分自相关函数的轴对象2包含4个类型为stem, line的对象。

图中没有显示出显著的自相关。和以前一样，自相关似乎被异方差掩盖了。假设检验，如Ljung-Box q检验，在发现DGP的自相关性方面同样无效。这种情况在实践中是典型的，并指出了确定一个准确的创新协方差模型的困难。

自回归协方差模型使用“AR”选择“innovModel”参数在fgls．然而，在没有证据表明模型的特定滞后顺序的情况下，这涉及到另一个“妨害参数”的选择:

numLags = 5;%考虑具有这么多AR滞后的模型。numCoeffs=4；coeffs=0（numLags，numCoeffs）；ses=0（numLags，numCoeffs）；对于滞后=1:numLags[coeff，se]=fgls（数据表，“innovMdl”,“AR”,“arLags”、延迟);:多项式系数(滞后)=多项式系数”;ses(滞后:)= se ';结束曲线图（系数，“啊——”,“线宽”，2）设置（gca，“XTick”，1:numLags）xlabel(基于“增大化现实”技术的落后的)({传奇“常量”,X1的,“X2”,“X3”})标题(“{\bf系数}”网格)在

图中包含一个轴对象。标题为空白的轴对象包含4个类型为line的对象。这些对象表示Const, X1, X2, X3。

图绘制(ses,“啊——”,“线宽”，2）设置（gca，“XTick”，1:numLags）xlabel(基于“增大化现实”技术的落后的)({传奇“常量”,X1的,“X2”,“X3”})标题({} \男朋友标准错误的网格)在

图中包含一个轴对象。具有标题空白S t和d r d r r or r S的轴对象包含4个类型为line的对象。这些对象表示Const, X1, X2, X3。

在AR模型的范围内，图显示出对估计的影响很小，只有截距估计的标准误差发生了显著变化。

FGLS估计经常被迭代，通过重新计算残差和协方差估计，在每一步。FGLS估计量的渐近分布在第一次迭代后没有变化，但对有限样本分布的影响却知之甚少。的numIter中的参数fgls函数提供了一种机制，用于在特定情况下调查迭代FGLS估计的行为：

fgls（数据表，“numIter”,5，“阴谋”，{“科夫”,“se”});

图中包含一个Axis对象。标题为空的Axis对象包含12个line类型的对象。这些对象表示常量、X1、X2、X3。

图中包含一个轴对象。具有标题空白S t和d r d r r or r S的轴对象包含12个类型为line的对象。这些对象表示Const, X1, X2, X3。

在这种情况下，默认的AR(1)模型被迭代五次。估计仅经过几次迭代就收敛了。

当预测因子弱依赖且严格外生时，FGLS估计是有偏的，但是一致的，并且渐近地比OLS估计更有效。然而，如果没有预测因子的外生性，总的来说，FGLS不再是一致的(因此也不是有效的)。对于模拟中出现的非外生性类型，不存在对估计一致性的损害。

FGLS估计值在计量经济学中有着悠久的历史。早期的计算方法，如Cochrane-Orcutt程序及其变异(Prais-Winsten, Hatanaka, Hildreth-Lu等)，使用OLS方法估计协方差模型中的参数(通常是AR(1)或AR(2))。现代FGLS估计器，如fgls，采用渐近更有效的最大似然估计(MLE)技术来计算模型参数，但总体方法是相同的。

总结

当回归模型与CLM假设“错误指定”，且残差序列表现出非球形行为时，HAC和FGLS估计器是评估模型系数可靠性的有用工具。正如本例所示，这两种方法在有限的样本中都有其局限性。值得注意的是，为了提供可靠的结果，FGLS估计量需要严格的外生回归量，以及创新协方差的特定模型。HAC估计所需的初始诊断信息要少得多，但其准确性也往往相对较低。一般来说，与大多数计量分析一样，应使用多种技术，作为对估计量敏感性进行更全面审查的一部分。的醋酸和fgls计量经济学工具箱中的接口为开展这些调查提供了灵活的框架。