主要内容

时间序列回归VIII:滞后变量和估计偏差

这个例子展示了滞后预测因子如何影响多元线性回归模型的最小二乘估计。这是关于时间序列回归的一系列例子中的第8个,在前面的例子中有介绍。

介绍

许多计量经济学模型都是如此动态,使用滞后变量随时间整合反馈。相比之下,静态时间序列模型表示只对当前事件作出响应的系统。

滞后变量有几种类型:

  • 分布式滞后(DL)变量是滞后值 x t - k 观察到的外源性预测变量 x t

  • 自回归(AR)变量是滞后值 y t - k 观察到的内源性反应变量 y t

  • 移动平均线(毫安)变量是滞后值 e t - k 未观测到的随机创新过程 e t

动态模型通常使用不同类型滞后变量的线性组合构建,以创建ARMA、ARDL和其他混合模型。在每种情况下,建模目标都是准确、简洁地反映相关经济因素之间的重要交互作用。

动态模型规范提出了这样一个问题:哪些滞后是重要的?一些模型,如季节模型,在数据的不同时期使用滞后。其他模型基于对经济行动者如何以及何时对不断变化的条件作出反应的理论考虑。一般来说,滞后结构识别对已知先行指标的响应的时间延迟。

然而,滞后结构必须做的不仅仅是代表现有的理论。因为动态规范会在变量之间产生相互作用,从而影响标准回归技术,所以在设计滞后结构时也必须考虑到准确的模型估计。

规范问题

考虑多元线性回归(MLR)模型:

y t Z t β + e t

在哪里 y t 是观察到的反应, Z t 包括每个潜在相关预测变量的列,包括滞后变量,和 e t 是一个随机的创新过程。中系数估计的精度 β 取决于的组成列 Z t ,以及 e t .选择预测 Z t 在统计上和经济上都具有重要意义的通常包括评估、残差分析和重新规范的周期。

示例中讨论的经典线性模型(CLM)假设时间序列回归I:线性模型,允许普通最小二乘(OLS)产生的估计 β 具有理想的特性:相对于其他估计量,无偏、一致和有效。滞后指标在 Z t ,但是,可能会引入违反CLM假设的情况。具体的违规取决于模型中滞后变量的类型,但动态反馈机制的存在,通常倾向于夸大与静态规范相关的问题。

模型规范问题通常是相对于响应变量的数据生成过程(DGP)进行讨论的 y t .然而,在实际中,DGP是一个理论结构,只有在仿真中才能实现。没有模型能完全捕捉真实世界的动态,模型系数也在其中 β 总是真实DGP中的子集。因此,创新在 e t 成为过程内在随机性和潜在的大量遗漏变量(OVs)的混合体。自我在 e t 在ov随时间表现出持久性的计量模型中是常见的。与其将模型与理论的DGP进行比较,不如评估数据中的动态是否已与残差中的自相关性区分开来,或者在何种程度上区分开来。

最初,滞后结构可能包括在多个近似时间对经济因素的观察。然而,观察时间t可能与观测结果相关吗t- 1,t- 2,以此类推,通过经济惯性。因此,滞后结构可能overspecify通过包括一系列对DGP贡献甚微的滞后预测因子,来研究响应的动态。该规范将夸大过去历史的影响,而没有对模型施加相关的限制。扩展的滞后结构也需要扩展的前样本数据,在估计过程中减少样本大小和自由度的数目。因此,过度指定的模型可能表现出明显的共线性和高估计量方差的问题。结果估计 β 精度较低,很难分离单个效果。

为了减少预测依赖性,可以限制滞后结构。但是,如果限制太严格,则会出现其他估计问题。限制滞后结构可能会不明确通过排除实际上是gdp重要组成部分的预测指标,来研究响应的动态。这导致了一个低估过去历史影响的模型,迫使重要的预测者进入创新过程。如果滞后预测 e t 与预测因子的近似滞后相关 Z t ,违反了回归量严格外生性的CLM假设,OLS估计 β 变得有偏见和不一致。

具体问题与不同类型的滞后预测因素有关。

滞后外生因素 x t - k ,不违反CLM假设。然而,DL模型通常被描述,至少在最初,由一个长序列潜在的相关的滞后,因此遭受上述过度规范的问题。通常(如果是特别的)方法对滞后权重(即 β )在例子中进行了讨论时间序列回归IX:滞后顺序选择.然而,从原则上讲,DL模型的分析与静态模型的分析是相似的。与共线性、有影响的观测、伪回归、自相关或异方差创新等相关的估计问题仍然必须加以检验。

落后于内生因素 y t - k 有更多的问题。AR模型引入了CLM假设的违背,导致有偏差的OLS估计 β 没有任何其他的CLM违规,估计仍然是一致的和相对有效的。考虑一个简单的一阶自回归 y t y t - 1

y t β y t - 1 + e t

在这个模型中, y t 是由两者共同决定的 y t - 1 e t .将方程一步一步地向后移动, y t - 1 是由两者共同决定的 y t - 2 e t - 1 y t - 2 是由两者共同决定的 y t - 3. e t - 2 ,等等。传递性地,预测因子 y t - 1 与创新过程的整个历史相关。与规格不足一样,CLM严格外生性假设被违反,OLS估计 β 成为有偏见。因为 β 必须吸收各自的影响吗 e t - k ,模型残差不再代表真正的创新[10]

当AR模型中的创新是自相关的时,问题就更加复杂了。如示例中所讨论的时间序列回归VI:残留诊断,在没有其他CLM违规的情况下,自相关创新产生了无偏的,如果潜在的高方差,模型系数的OLS估计。在这种情况下,主要的复杂情况是,系数的标准误差的通常估计量变得有偏差。(异方差创新的影响类似,但通常不那么明显。)然而,如果自相关的创新与严格外生性的违反相结合,如AR术语所产生的,估计 β 变得有偏见和不一致。

如果落后于创新 e t - k 被用作预测者,估计过程的性质从根本上改变了,因为创新不能被直接观察到。估计需要将MA项倒置形成无限的AR表示,然后限制生成一个可以在实践中估计的模型。由于在估计过程中必须施加限制,需要使用除OLS以外的数值优化技术,例如最大似然估计(MLE)。本例中考虑了具有MA项的模型时间序列回归IX:滞后顺序选择

模拟估计量的偏差

为了说明由滞后内生预测因子引入的估计偏差,考虑下面的DGP:

y t β 0 y t - 1 + e t

e t γ 0 e t - 1 + δ t

δ t N 0 σ 2

我们对该模型进行了两组重复的蒙特卡罗模拟。第一组使用正态分布和独立分布(NID)创新,具有 γ 0 0 .第二套使用了AR(1)创新 | γ 0 | > 0

%构建模型组件:beta0 = 0.9;y_t的% AR(1)参数gamma0 = 0.2;e_t的% AR(1)参数AR1 = arima (基于“增大化现实”技术的beta0,“不变”,0,“差异”1);AR2 = arima (基于“增大化现实”技术的,gamma0,“不变”,0,“差异”1);%模拟样本量:T = (50100500, 1000);numSizes =长度(T);%运行模拟:numObs=最大值(T);%仿真路径长度numPaths = 1 e4;%模拟路径数燃烧= 100;%初始瞬态时间,待丢弃σ= 2.5;%创新的标准偏差E0 =σ* randn(燃烧+ numObs numPaths 2);创新%国家免疫日E1Full = E0 (:: 1);Y1Full =过滤器(AR1 E1Full);% AR(1)流程与NID创新E2Full =过滤器(AR2 E0 (:,: 2));Y2Full =过滤器(AR1 E2Full);% AR(1)流程与AR(1)创新清晰的E0%提取仿真数据,暂态期后:日元= Y1Full(燃烧+ 1:最终,);% Y1 (t)LY1=Y1Full(烧成:端-1,:);% Y1 (t - 1)Y2 = Y2Full(燃烧+ 1:最终,);% Y2 (t)LY2=Y2Full(烧成:1号端,:);% Y2 (t - 1)清晰的Y1FullY2Full计算β的OLS估计值:BetaHat1 = 0 (numSizes numPaths);BetaHat2 = 0 (numSizes numPaths);对于i = 1:numSizes n = T(i);对于j = 1: numPaths BetaHat1 (i, j) = LY1 (1: n, j) \ Y1 (1: n, j);BetaHat2 (i, j) = LY2 (1: n, j) \ Y2 (1: n, j);终止终止%设置绘图域:w1=std(BetaHat1(:);x1=(beta0-w1):(w1/1e2):(beta0+w1);w2=std(BetaHat2(:);x2=(beta0-w2):(w2/1e2):(beta0+w2);%创建图形和绘图手柄:hFig1 =图;持有hPlots1 = 0 (numSizes, 1);hFig2 =图;持有hPlots2=零(numizes,1);% Plot estimator分布:颜色=冬天(numSizes);对于i = 1:numSizes c = colors(i,:);图(hFig1);f1 = ksdensity (BetaHat1(我,:),x1);hPlots1 (i) =情节(x1, f1,“颜色”c“线宽”2);图(hFig2);f2 = ksdensity (BetaHat2(我,:),x2);hPlots2 (i) =情节(x2, f2,“颜色”c“线宽”2);终止%注释块:图(hFig1) hBeta1 = line([beta0 beta0],[0 (1.1)*max(f1)],“颜色”“c”“线宽”2);包含(“估计”) ylabel (“密度”)标题(“{\bf OLS对\beta_='0'的估计”num2str (beta0, 2),创新}’”,国家免疫日])传说([hPlots1; hBeta1], [strcat ({“T =”}, num2str (T ',“% - d”));[“\ beta_0 = 'num2str (beta0 2)]])轴网格持有

图中包含一个轴对象。轴对象的标题空白O L S空白E S ti m a t S空白的空白β指数的0基线空白=空白0。9、blank N I D blank I N o v a t o s包含6个line类型的对象。这些对象表示T = 10, T = 50, T = 100, T = 500, T = 1000, \beta_0 = 0.9。

图(hFig2) hBeta2 = line([beta0 beta0],[0 (1.1)*max(f2)],“颜色”“c”“线宽”2);包含(“估计”) ylabel (“密度”)标题(“{\bf OLS对\beta_='0'的估计”num2str (beta0, 2),“,AR(1)创新}”])传说([hPlots2; hBeta2], [strcat ({“T =”}, num2str (T ',“% - d”));[“\ beta_0 = 'num2str (beta0 2)]])轴网格持有

图中包含一个轴对象。轴对象的标题空白O L S空白E S ti m a t S空白的空白β指数的0基线空白=空白0。9、空白A R(1)空白I n n v t I o s包含6个对象的类型行。这些对象表示T = 10, T = 50, T = 100, T = 500, T = 1000, \beta_0 = 0.9。

在以上所有的模拟中, β 0 0 9 .这些图是 β 0 ˆ 在每个过程的多个模拟中,显示了OLS估计量的偏差和方差作为样本量的函数。

分布的偏差使得很难直观地评估它们的中心。偏见被定义为 E β 0 ˆ - β 0 ,所以我们用均值来衡量总体估计值。在NID创新的情况下,一个相对较小的负偏差逐渐消失,因为累计估计单调地增加 β 0

AggBetaHat1 =意味着(BetaHat1, 2);流(% 6 s % 6年代\ n“尺寸”“Mean1”
平均尺寸1
对于i = 1:numSizes fprintf(“% 6 u % -6.4 f \ n”AggBetaHat1 T(我),(我))终止
10 0.7974 50 0.8683 100 0.8833 500 0.8964 1000 0.8981

在AR(1)创新的情况下,在小样本中具有负偏差的合计估计值单调地向 β 0 ,但在中等样本量时通过DGP值,在大样本量时逐渐变得更有正偏差:

AggBetaHat2 =意味着(BetaHat2, 2);流(% 6 s % 6年代\ n“尺寸”“非常刻薄的”
尺寸平均值2
对于i = 1:numSizes fprintf(“% 6 u % -6.4 f \ n”AggBetaHat2 T(我),(我))终止
10 0.8545 50 0.9094 100 0.9201 500 0.9299 1000 0.9310

自相关创新中OLS估计量的不一致性在计量经济学家中广为人知。尽管如此,它给出了一系列样本量的准确估计,但其实际后果却不那么广泛。我们将在本节中进一步描述这种行为动态相关效应

在OLS估计方面,上述两组模拟的主要区别在于创新和预测器之间的交互是否存在延迟。在具有NID创新的AR(1)过程中,预测器 y t - 1 与同一时间不相关 e t ,但与之前所有的创新相关,如前所述。在具有AR(1)创新的AR(1)过程中,预测器 y t - 1 成为与 e t 同样,通过自相关 e t e t - 1

为了了解这些关系,我们计算了它们之间的相关系数 y t - 1 和两个 e t e t - 1 分别针对每个流程:

%提取创新数据,暂态期后:E1 = E1Full(燃烧+ 1:最终,);% E1 (t)LE1 = E1Full(燃烧:end-1:);% E1 (t - 1)E2=E2满(磨合+1:结束,:);%E2(t)LE2 = E2Full(燃烧:end-1:);%E2(t-1)清晰的E1FullE2Full%预分配相关系数:CorrE1=零(numizes,numPaths);correle1=零(numizes,numPaths);CorrE2=零(numizes,numPaths);correle2=零(numizes,numPaths);计算相关系数:对于i = 1:numSizes n = T(i);对于j = 1: numPaths% NID创新:(CorrE1 (i, j) = corr LY1 (1: n, j), E1 (1: n, j));(CorrLE1 (i, j) = corr LY1 (1: n, j), LE1 (1: n, j));%有AR(1)创新(CorrE2 (i, j) = corr LY2 (1: n, j) E2 (1: n, j));(CorrLE2 (i, j) = corr LY2 (1: n, j), LE2 (1: n, j));终止终止%设置绘图域:sigmaE1 =性病(CorrE1 (:));muE1 =意味着(CorrE1 (:));xE1 = (muE1-sigmaE1): (sigmaE1/1e2): (muE1 + sigmaE1);sigmaLE1 =性病(CorrLE1 (:));muLE1 =意味着(CorrLE1 (:));xLE1 = (muLE1-sigmaLE1/2): (sigmaLE1/1e3): muLE1;sigmaE2 =性病(CorrE2 (:));muE2 =意味着(CorrE2 (:));xE2 = (muE2-sigmaE2): (sigmaE2/1e2): (muE2 + sigmaE2);sigmaLE2 =性病(CorrLE2 (:)); muLE2 = mean(CorrLE2(:)); xLE2 = (muLE2-sigmaLE2):(sigmaLE2/1e2):(muLE2+sigmaLE2);%创建图形和绘图手柄:hFigE1=数字;保持hPlotsE1 = 0 (numSizes, 1);hFigLE1 =图;持有hPlotsLE1 = 0 (numSizes, 1);hFigE2 =图;持有hPlotsE2 = 0 (numSizes, 1);hFigLE2 =图;持有hPlotsLE2 = 0 (numSizes, 1);%绘图相关系数分布:颜色=铜(numSizes);对于i=1:numizes c=colors(i,:);figure(hFigE1)fE1=ksdensity(CorrE1(i,:),xE1);hPlotsE1(i)=plot(xE1,fE1,“颜色”c“线宽”2);图(hFigLE1) fLE1 = ksdensity(CorrLE1(i,:),xLE1);hPlotsLE1 (i) =情节(xLE1 fLE1,“颜色”c“线宽”2);图(hFigE2) fE2 = ksdensity(CorrE2(i,:),xE2);hPlotsE2 (i) =情节(xE2、价“颜色”c“线宽”图(hFigLE2)fLE2=ksdensity(correle2(i,:),xLE2);hPlotsLE2(i)=plot(xLE2,fLE2,“颜色”c“线宽”2);终止清晰的CorrE1CorrLE1CorrE2CorrLE2%注释块:图(hFigE1)包含(“相关系数”) ylabel (“密度”)标题('{\bf {it y_{t-1}}与NID {\it e_t}}的样本相关性')图例(hPlotsE1、strcat({“T =”}, num2str (T ',“% - d”)),“位置”“西北”)轴心网格ylim([0(1.1) *马克斯(fE1)])

图中包含一个轴对象。坐标轴对象与标题空白S m p l e C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d n i d空白e indexOf t基线包含5线类型的对象。这些对象代表T = 10, T = 50, T = 100, T = 500, T = 1000。

图(hFigLE1)xlabel(“相关系数”) ylabel (“密度”)标题({\bf {it y_{t-1}}与NID {\it e_{t-1}}的样本相关性)图例(hPlotsLE1、strcat({“T =”}, num2str (T ',“% - d”)),“位置”“西北”)轴心网格ylim([0(1.1)*最大值(fLE1)]保持

图中包含一个轴对象。标题为空白的轴对象S a m p l e blank C o r e l a t i o n blank o f blank y indexOf t-1基线空白a n d blank n i d blank e indexOf t-1基线包含5个行类型的对象。这些对象表示T=10、T=50、T=100、T=500、T=1000。

图(hFigE2)包含(“相关系数”) ylabel (“密度”)标题({\bf {it y_{t-1}}与AR(1) {\it e_t}}的样本相关性)传说(hPlotsE2 strcat ({“T =”}, num2str (T ',“% - d”)),“位置”“西北”)轴心网格ylim([0(1.1)*最大(fE2)]保持

图中包含一个轴对象。坐标轴对象标题空白S m p l e空白C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d r(1)空白空白e indexOf t基线包含5线类型的对象。这些对象代表T = 10, T = 50, T = 100, T = 500, T = 1000。

图(hFigLE2)xlabel(“相关系数”) ylabel (“密度”)标题(的{{\ bf样本相关性\它y_ {t - 1}}和AR(1){\它e_ {t - 1}}}”)传说(hPlotsLE2 strcat ({“T =”}, num2str (T ',“% - d”)),“位置”“西北”)轴心网格ylim([0(1.1) *马克斯(fLE2)])

图中包含一个轴对象。标题为空白的轴对象S a m p l e blank C o r e l a t i o n blank o f blank y indexOf t-1基线空白a n d blank a r(1)blank e e indexOf t-1基线包含5个类型行对象。这些对象表示t=10、t=50、t=100、t=500、t=1000。

这些图显示了两者之间的相关性 y t - 1 e t - 1 在这两种情况下。之间的相关性 y t - 1 e t ,然而,只有在AR(1)创新的情况下才会持续渐进。

相关系数是自相关标准度量的基础。上图突出了有限样本中相关系数的偏差和方差,使得模型残差中自相关的实际评价变得复杂。Fisher ([3][4][5]),他提出了许多可供选择的方案。

使用有偏估计 β 0 估计 γ 0 在残差中也是有偏差的[11].如前所述,在AR(1)创新的情况下,OLS残差不能准确地代表工艺创新,因为倾向于 β 0 ˆ 吸收自相关扰动所产生的系统影响。

更复杂的是,杜宾-沃森统计数据,通常被报道为一阶自相关程度的衡量,是有偏见的检测之间的任何关系 e t ˆ e ˆ t - 1 在存在这种关系的AR模型中。偏差是内偏差的两倍 β 0 ˆ [8]

因此,OLS可能持续高估 β 0 而剩余自相关的标准度量低估了导致不一致的条件。这会产生一种扭曲的拟合优度感觉,以及对动态项重要性的错误表述。Durbin h 测试在这种情况下同样是无效的[7].德宾的 通常更倾向于采用类似的Breusch-Godfrey测试[1]

近似估计偏差

在实践中,必须从可用的数据中发现产生时间序列的过程,而这种分析最终会受到估计量偏差和方差带来的置信度损失的限制。经济数据的样本量通常在上述模拟中考虑的样本量的低端,因此不准确性可能非常大。自回归模型的预测性能可能会受到严重的影响。

对于具有简单创新结构的简单AR模型,从理论上给出了OLS估计偏差的近似。这些公式在评估从单一数据样本得到的AR模型系数的可靠性时很有用。

在NID创新的情况下,我们可以将模拟偏差与广泛使用的近似值进行比较[11][13]

E β 0 ˆ - β 0 - 2 β 0 / T

m = min (T);M = max (T);eBias1 = AggBetaHat1-beta0;%估计偏差tBias1 = 2 * beta0. / T;%的理论偏差eB1interp = interp1 (T eBias1 m: m,“pchip”); tB1interp=interp1(T,tBias1,m:m,“pchip”);图绘制(T eBias1“罗”“线宽”,2)保持eB1interp he1 =情节(m: m,“r”“线宽”2);情节(T, tBias1“波”) ht1 = plot(m: m,tB1interp,“b”);持有传奇([he1 ht1),“模拟偏差”“近似理论偏见”“位置”“E”)包含(“样本”) ylabel (“偏见”)标题(“{\bf估计偏差,NID创新}”)网格

图中包含一个轴对象。该轴对象的标题为空白E和空白B i a s,空白N i D空白i N a ts,包含4个类型为line的对象。这些对象代表模拟偏差,近似理论偏差。

即使在中等规模的样本中,这种近似也是相当可靠的,一般在 β 0 绝对值减少。

对于AR(1)创新,偏差取决于两者 β 0 γ 0 .渐近地,它近似为[6]

E β 0 ˆ - β 0 γ 0 1 - β 0 2 / 1 + γ 0 β 0

eBias2 = AggBetaHat2-beta0;%估计偏差tBias2 = gamma0 * (1-beta0 ^ 2) / (1 + gamma0 * beta0);%渐近的偏见eB2interp = interp1 (T eBias2 m: m,“pchip”);图绘制(T eBias2“罗”“线宽”,2)保持何=情节(m: m、eB2interp“r”“线宽”2);ht2 =情节(0:M, repmat (tBias2 1 M + 1),“b”“线宽”2);持有图例([he2 ht2],“模拟偏差”“近似渐近偏见”“位置”“E”)包含(“样本”) ylabel (“偏见”)标题(“{\bf估计偏差,AR(1)创新}”)网格

图中包含一个轴对象。该轴对象的标题为空白E t t t t t t o s,空白a r(1)空白in o t o s包含3个类型的对象。这些对象代表模拟偏差,近似渐近偏差。

在这里,我们看到随着样本量的增加,偏差从负值移动到正值,然后最终接近渐近界。有一个样本量范围,从25到100,其中偏差的绝对值低于0.02。在这样一个“最佳点,”OLS估计器的性能可能优于专门用于解释自相关存在的替代估计器。我们将在本节中进一步描述这种行为动态相关效应

图中近似渐近偏差是有用的 β 0 ˆ 两者的函数 β 0 γ 0 ,以了解在两种情况下改变自相关度的影响 y t e t

Figure beta = -1:0.05:1;γ= 1:0.05:1;[βγ]= meshgrid(βγ);持有冲浪(βγγ。*(1测试版^ 2)。/(1 +γ。*β))无花果= gcf;厘米= fig.Colormap;numC =尺寸(厘米,1);zL = zlim;zScale = zL (2) zL (1);iSim = (tBias2-zL (1)) * numC / zScale;cSim = interp1 (1: numC,厘米,iSim);恒生投资管理公司= plot3 (beta0 gamma0 tBias2,“柯”“MarkerSize”8“MarkerFaceColor”, cSim);视图(-20,20)ax = gca;u = ax.XTick;v = ax.YTick;网格(u, v, 0(长度(v),长度(u)),“FaceAlpha”, 0.7,“EdgeColor”“k”“线型”“:”)举行传奇(恒生投资管理公司,“模拟模型”“位置”“最佳”)包含(“\ beta_0”) ylabel (“\ gamma_0”)兹拉贝尔(“偏见”)标题(“{\bf近似渐近偏差}”)灯光色条网格

图中包含一个轴对象。标题为空白A p p r x i m t e空白A s y m t t t c空白B的轴对象包含类型为面、线的3个对象。这个对象表示模拟模型。

渐近偏差变得显著时 β 0 γ 0 向相反的方向移动,远离零自相关。当然,在有限的样本中,偏差可能要小得多。

动态相关效应

如前所述,使用OLS进行动态模型估计的挑战来自CLM假设的违背。有两种违反是关键的,我们在这里详细讨论它们的影响。

第一个是动态效果,这是由预测因子之间的相关性引起的 y t - 1 以及之前所有的创新 e t - k .这发生在任何AR模型中,并导致有限样本的有偏OLS估计。在没有其他违规行为的情况下,苏丹生命线行动仍然保持一致,而且在大样本中偏见消失了。

第二个是相关的影响,这是由预测因子之间的同期相关性引起的 y t - 1 以及创新 e t .这种情况发生在创新过程是自相关的时候,并导致预测器的OLS系数接收到太多或太少的响应的同步变化,这取决于相关的符号。也就是说,它产生了一种持久的偏见。

上面的第一组模拟说明了这样一种情况 β 0 是积极的,也是积极的 γ 0 是零。第二组模拟演示了两种情况 β 0 γ 0 这些都是积极的。积极的 β 0 ,动态的影响 β 0 ˆ 是负的。积极 γ 0 的相关效应 β 0 ˆ 是正的。因此,在第一组模拟中,在样本大小上存在负偏差。而在第二组模拟中,两种效应之间存在竞争关系,小样本中动态效应占主导地位,大样本中相关效应占主导地位。

正AR系数在计量模型中很常见,因此这两种效应相互抵消是典型的,从而产生了一系列的样本量,其中OLS偏差显著降低。这个范围的宽度取决于 β 0 γ 0 ,并确定OLS-superior范围其中,OLS优于在创新中为直接解释自相关性而设计的备选估计器。

对影响大小的一些因素的动态和相关效应进行了总结[9].其中包括:

动态效果

  • 随样本量的减少而增加。

  • 随着时间的增加而减少 β 0 如果创新的方差是固定的。

  • 随着时间的增加而减少 β 0 如果对创新的方差进行调整以保持不变 R 2

  • 随着创新的变化而增加。

相关效应

  • 随著增加而增加 γ 0 ,以下降的速度。

  • 随着时间的增加而减少 β 0 ,以日益增长的速度。

这些因素的影响可以通过改变上述模拟中的系数来测试。总的来说,动态效应越大,相关效应越小,ols优势范围越宽。

重叠的偏见减少

重叠过程是一种交叉验证技术,通常用于减少样本统计的偏差。模型系数的Jacknife估计量相对容易计算,无需进行大型模拟或重采样。

其基本思想是从整个样本中计算出一个估计值从一个子样本序列中,然后以消除部分偏差的方式合并估计。一般来说,对于样本大小 T , OLS估计量的偏差 β 0 ˆ 可以表示为?的幂展开 T - 1

E β 0 ˆ - β 0 w 1 T + w 2 T 2 + O T - 3.

重量在哪里 w 1 w 2 取决于比系数和模型。如果估计 β ˆ 都是按顺序制作的 1 子样本的长度 l O T ,则折刀估计 β 0 是:

β J ˆ T T - l β 0 ˆ - l T - l 1 1 β ˆ

可以证明,刀切估计器满足:

E β 0 ˆ - β 0 O T - 2

因此,删除 O T - 1 偏差扩展中的项。偏差是否实际减少取决于扩展中剩余项的大小,但刀切估计在实践中表现良好。特别是,该技术对于非正态创新、ARCH效应和各种模型错误说明具有鲁棒性[2]

统计和机器学习工具箱™功能重叠使用“省略一”子样本的系统序列实现折叠程序。对于时间序列,删除观测值会改变自相关结构。为了在时间序列中保持相关性结构,折刀程序必须使用不重叠的子样本,如分区或移动块。

下面实现了一个简单的折刀估计 β 0 ˆ 使用每个模拟中的数据分区来产生子样本估计 β ˆ .我们用NID或AR(1)创新技术对模拟数据进行折刀前后的性能比较:

m=5;%子样本数量% Preallocate记忆:betaHat1=零(m,1);%子样本估计,NID创新betaHat2=零(m,1);%子样本估计,AR(1)创新BetaHat1J=零(numizes,numPaths);Jackknife估计,NID创新BetaHat2J = 0 (numSizes numPaths);Jackknife估计,AR(1)创新%计算折刀估计:对于i = 1:numSizes n = T(i);%样本量l=n/m;%分区子区间长度对于j = 1: numPaths对于s = 1: m betaHat1 (s) = LY1 ((s - 1) * l + 1: * l, j) \ Y1 ((s - 1) * l + 1: * l, j);betaHat2 (s) = LY2 ((s - 1) * l + 1: * l, j) \ Y2 ((s - 1) * l + 1: * l, j);BetaHat1J (i, j) = (n / (n-l)) * BetaHat1 (i, j) - (l / ((n-l) *米))*总和(BetaHat1);BetaHat2J (i, j) = (n / (n-l)) * BetaHat2 (i, j) - (l / ((n-l) *米))*总和(BetaHat2);终止终止终止清晰的BetaHat1BetaHat2显示折刀前后的平均估算值:AggBetaHat1J =意味着(BetaHat1J, 2);清晰的BetaHat1J流(% 6 s % 8 s % 8年代\ n”“尺寸”“Mean1”“Mean1J”
大小Mean1 Mean1J
对于i = 1:numSizes fprintf(“%-6u%-8.4f%-8.4f\n”,T(i),AggBetaHat1(i),AggBetaHat1J(i))终止
10 0.7974 0.8055 50 0.8683 0.8860 100 0.8833 0.8955 500 0.8964 0.8997 1000 0.8981 0.8998
AggBetaHat2J=平均值(BetaHat2J,2);清除BetaHat2J流(% 6 s % 8 s % 8年代\ n”“尺寸”“非常刻薄的”“Mean2J”
大小非常刻薄的Mean2J
对于i = 1:numSizes fprintf(“%-6u%-8.4f%-8.4f\n”,T(i),AggBetaHat2(i),AggBetaHat2J(i))终止
10 0.8545 0.8594 50 0.9094 0.9233 100 0.9201 0.9294 500 0.9299 0.9323 1000 0.9310 0.9323

子样本的数量, 5 ,以最小的样本量选择, n 1 0 ,记住。更大 在较大的样本中可能会提高性能,但选择子样本大小没有公认的启发式方法,因此需要进行一些实验。代码很容易适应使用替代子样本方法,例如移动块。

结果表明,NID创新的偏差均匀减少。在AR(1)创新的情况下,该程序似乎能更快地将估计值推过OLS优势范围。

总结

这个例子展示了一个简单的AR模型,以及一些简单的创新结构,以此来说明与动态模型估计相关的一些一般问题。这里的代码很容易修改,以观察改变参数值、调整创新方差、使用不同的滞后结构等的影响。解释性DL术语也可以添加到模型中。DL项具有降低估计偏差的能力,尽管OLS倾向于以DL系数为代价过高估计AR系数[11]。此处的一般设置允许进行大量实验,这是在实际评估模型时经常需要的。

当考虑任何估值器的偏差和方差所呈现的权衡时,重要的是要记住,与方差较高的无偏估值器相比,方差减小的有偏估值器可能具有更好的均方误差特性。OLS估值器的一个优点是,除了计算简单外,它的随着样本量的增加减少方差的相对效率。这通常足以采用OLS作为选择的估计量,即使对于动态模型也是如此。另一个优点,如本例所示,是OLS优势范围的存在,即使在通常认为的不利条件下,OLS也可能优于其他估计量OLS估计的最薄弱点是它在小样本中的性能,在小样本中,偏差和方差可能是不可接受的。

在这个例子中提出的估计问题表明,需要新的自相关指标,并在其存在的情况下使用更稳健的估计方法。示例中描述了其中一些方法时间序列回归X:广义最小二乘和HAC估计然而,正如我们所看到的,AR模型的OLS估计量与自相关的不一致性不足以排除它作为更复杂、一致估计量(如最大似然、可行广义最小二乘和工具变量)的可行竞争对手,后者试图消除相关效应ct,但不改变动态效应。最佳选择取决于样本量、滞后结构、外生变量的存在等,通常需要本例中给出的各种模拟。

参考文献

[1]Breusch t.s.和l.g. Godfrey。动态同时模型中自相关检验的最新工作综述在Currie, D., R. Nobay和D. Peel(编)中,宏观经济分析:宏观经济学和计量经济学论文。伦敦:Croom Helm, 1981年出版。

[2]钱伯斯,m . J。平稳自回归模型的折刀估计。埃塞克斯大学讨论论文第684号,2011。

[3]费舍尔,r . .来自无定大总体的样本的相关系数值的频率分布生物统计学.第十卷,1915年,第507-521页。

[4]费舍尔,r。从小样本推导出的相关系数的“可能误差”密特隆.1921年第1卷,3-32页。

[5]费舍尔,r。偏相关系数的分布密特隆1924年第3卷,第329-332页。

[6]动态时间序列模型中的统计估计和因果推断问题〉,摘自Costner,H.(编辑)社会学研究方法旧金山:Jossey Bass,1974年。

[7]包含滞后因变量的模型中自相关检验的有限样本幂经济学的信件.《中国科学院大学学报(自然科学版)》1984年第14卷,第179 - 185页。

[8]约翰斯顿(J。计量经济学方法.纽约:麦格劳-希尔出版社,1972年出版。

[9]教授具有滞后因变量和自相关干扰的回归经济教育学报第27卷,1996年,第72-84页。

[10]一个OLS偏倚的例子YtλYt1+Ut."经济教育学报.第31卷,2000年,76-80页。

[11]Malinvaud E。计量经济学的统计方法.阿姆斯特丹:北荷兰,1970年。

[12]自相关估计中的偏差生物统计学1954年第41卷,第390-402页。

[13]序列相关系数均值和方差的渐近展开生物统计学.第48卷,1961年,85-94页。