主要内容

预报

班级:蛙羊皮

预测具有ARIMA误差的回归模型的响应

语法

[Y,YMSE] =预测(MDL,NumPerioDS)
[Y, YMSE U] =预测(Mdl numperiods)
[Y, YMSE U] =预测(Mdl numperiods,名称,值)

描述

YYMSE) =预测(MDL.numperiods.预测答复(Y),并生成相应的均方误差(YMSE)。

YYMSEU) =预测(MDL.numperiods.此外,还预测了具有ARIMA误差的回归模型的无条件干扰。

YYMSEU) =预测(MDL.numperiods.名称,价值带有一个或多个指定的附加选项的预测名称,价值对参数。

输入参数

全部展开

带有Arima错误的回归模型,指定为a蛙羊皮返回的模型蛙羊皮或者估计

的属性MDL.不能包含s。

预测地平线,或预测期间的时间点数,指定为正整数。

数据类型:双重的

名称-值参数

指定可选的逗号分隔的对名称,价值参数。名称参数名和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家

预先创新,初始化Arima错误模型的移动平均(MA)组件,指定为包括的逗号分隔对“E0”和数字列向量或数字矩阵。预报假设预先创新的意思是0。

  • 如果E0是列向量吗预报将其应用于每个预测的路径。

  • 如果E0Y0, 和U0如果矩阵具有多条路径,则它们必须具有相同的列数。

  • E0至少需要Mdl.Q行。如果E0包含额外的行,然后预报使用最新的预先创新。最后一行包含最新的预先创新。

默认情况下,如果U0至少包含Mdl.P+Mdl.Q行,然后预报推断E0U0如果U0行数量不足,以及预报不能推断出充分的观察U0从样本数据(Y0X0)那么E0是0。

数据类型:双重的

预先确定的无条件干扰,初始化Arima错误模型的自回归(AR)组件,指定为包括的逗号分隔对“情况”和数字列向量或数字矩阵。如果你没有指定样品前的创新E0预报使用U0推断出他们。

  • 如果U0是列向量吗预报将其应用于每个预测的路径。

  • 如果U0Y0, 和E0如果矩阵具有多条路径,则它们必须具有相同的列数。

  • U0至少需要Mdl.P行。如果U0包含额外的行,然后预报使用最新的预采样无条件扰动。最后一行包含最新的预采样无条件扰动。

默认情况下,如果预先数据数据(Y0X0)至少包含Mdl.P行,然后预报推断U0从样本数据。如果你没有指定前样本数据,那么所有需要的前样本无条件扰动都是0。

数据类型:双重的

预采样预测数据,初始化用于预测的模型,指定为逗号分隔对,由“X0”和一个数字矩阵X0是单独的时间序列变量。预报使用X0推断样本前无条件扰动U0。因此,如果您指定U0预报忽略了X0

  • 如果没有指定U0,然后X0至少需要Mdl.P要推断的行U0如果X0包含额外的行,然后预报使用最新的观察结果。最后一行包含每个系列的最新观测结果。

  • X0需要的列数与的长度相同mdl.beta.

  • 如果您指定X0,则还必须指定XF

  • 预报对待X0作为固定(非随机)矩阵。

数据类型:双重的

预测或未来的预测数据,指定为逗号分隔的对组成'xf'和一个数字矩阵。

列的列XF是单独的时间序列,每个时间序列对应于X0.行tXF包含t- 前方预测X0

如果您指定X0,则还必须指定XFXFX0需要相同数量的列。XF必须至少有numperiods.行。如果XFexceednumperiods.行,然后预报使用第一个numperiods.预测。

预报对待XF作为固定(非随机)矩阵。

默认情况下,预报在模型中不包括回归组件,无论在MDL.

数据类型:双重的

预先确定预测模型的预先响应数据,指定为逗号分隔的对“Y0”和数字列向量或数字矩阵。预报使用Y0推断样本前无条件扰动U0。因此,如果您指定U0预报忽略了Y0

  • 如果Y0是一个列向量,预报将其应用于每个预测的路径。

  • 如果Y0E0, 和U0如果矩阵具有多条路径,则它们必须具有相同的列数。

  • 如果没有指定U0,然后Y0至少需要Mdl.P要推断的行U0如果Y0包含额外的行,然后预报使用最新的观察结果。最后一行包含最新的观察结果。

数据类型:双重的

笔记

  • 年代E0U0X0XF, 和Y0表示缺失值和预报删除它们。软件合并预采样数据集(E0U0X0, 和Y0),然后使用列表方式删除任何s。预报同样删除s from.XF.删除数据中的S在数据中减少了样本大小。这种去除还可以产生不规则的时间序列。

  • 预报假设您同步预定数据,使得每个预定系列的最新观察同时发生。

  • X0与相同的预测矩阵一样X用于估计,仿真或推理MDL..此分配确保无条件干扰的正确推断,U0

  • 要在响应预测中包含回归组件,必须指定预测的预测器数据XF.也就是说,您可以指定XF还没有指定X0但是预报在指定时发出错误X0还没有指定XF

输出参数

全部展开

响应数据的最小均方误差(MMSE)预测,以数值矩阵的形式返回。Ynumperiods.行和numPaths列。

  • 如果没有指定Y0E0, 和U0,然后Y是一个numperiods.列向量。

  • 如果您指定Y0E0, 和U0,都拥有numPaths列,然后Y是一个numperiods.——- - - - - -numPaths矩阵

  • Y包含预测期。

数据类型:双重的

预测响应的均方误差(MSE),作为数字矩阵返回。YMSEnumperiods.行和numPaths列。

  • 如果没有指定Y0E0, 和U0,然后YMSE是一个numperiods.列向量。

  • 如果您指定Y0E0, 和U0,都拥有numPaths列,然后YMSE是一个numperiods.——- - - - - -numPaths矩阵

  • YMSE的预测误差方差期。

  • 预测数据并不会导致变异性YMSE因为预报对待XF作为一个非旋涡矩阵。

  • 的平方根YMSE预测的标准误差是多少Y

数据类型:双重的

最小均方误差(MMSE)预测未来ARIMA误差模型无条件扰动,返回为数值矩阵。Unumperiods.行和numPaths列。

  • 如果没有指定Y0E0, 和U0,然后U是一个numperiods.列向量。

  • 如果您指定Y0E0, 和U0,都拥有numPaths列,然后U是一个numperiods.——- - - - - -numPaths矩阵

  • U包含预测的无条件干扰期。

数据类型:双重的

例子

全部展开

用ARMA(2,1)误差预测以下回归模型在30个周期内的响应:

y t X t 0 1 - 0 2 + u t u t 0 5 u t - 1 - 0 8 u t - 2 + ε t - 0 5 ε t - 1

哪里 ε t 高斯是否具有差异0.1。

指定模型。模拟来自模型和两个预测序列的响应。

mdl0 = regarima('截距',0,基于“增大化现实”技术的{0.5 - -0.8},...“马”, -0.5,'beta',[0.1 -0.2],“差异”, 0.1);rng (1);%的再现性X = randn (130 2);y =模拟(Mdl0,130,'X', X);

将模型拟合到前100个观测值,并保留剩下的30个观测值来评估预测性能。

mdl = regarima('arlags'1:2);EstMdl =估计(Mdl y (1:10 0),'X'X (1:10 0,:));
ARMA(2,0)误差模型回归(高斯分布):值StandardError TStatistic PValue ________ _____________ __________ __________ Intercept 0.004358 0.021314 0.20446 0.83799 AR{1} 0.36833 0.067103 5.4891 4.0408e-08 AR{2} -0.75063 0.090865 -8.2609 1.4453e-16 Beta(1) 0.076398 0.023008 3.3205 0.00089863 Beta(2) -0.1396 0.023298 -5.9919 2.0741e-09方差0.079876 0.01342 5.9522 2.6453e-09

estmdl.是一个新的蛙羊皮包含估计的模型。估计贴近其真实值。

estmdl.来预测30个时间段。用图表将预测结果与抵抗者数据进行直观比较。

[YF,YMSE] =预测(estmdl,30,“Y0”y (1:10 0),...“X0”,X(1:100,:),'xf'X(101:最终,:));图绘制(y,“颜色”,[。7,.7,.7]);持有绘图(101:130,yF,“b”“线宽”2);情节(101:130,YF + 1.96 * SQRT(YMSE),'r:'...“线宽”2);情节(101:130、yf - 1.96 * sqrt (yMSE),'r:'“线宽”2);甘氨胆酸h =;= patch([repmat(101,1,2) repmat(130,1,2)]),...[H.YLIM PLIPLR(H.YLIM)],...[0 0 0 0],“b”);ph.FaceAlpha=0.1;图例(“观察”“预测”...'95%预测间隔''地点'“最佳”);标题([“30期预测和大约95%”...预测区间的])轴持有离开

图中包含一个轴对象。具有标题30周期预测的轴对象和近似95%的预测间隔包含5个类型的线条,修补程序。这些对象代表观察到,预测,95%的预测间隔。

在钉子户样本中的许多观察结果都超出了95%的预测区间。有两个原因:

  • 在本例中,预测器是随机生成的。估计将预测器视为固定的。基于估计数的95%预测间隔估计不考虑预测因子的可变性。

  • 通过剪切机会,估计期似乎比预测期更易失去。估计使用波动性较小的估计周期数据来估计参数。因此,基于估计的预测区间不应涵盖具有较大变异性的潜在创新过程的观测结果。

预测静止,使用带有ARMA(1,1)错误的回归模型的GDP,包括CPI作为预测器。

加载U.S.宏观经济数据集并预处理数据。

负载Data_USEconModel;loggdp = log(dataTable.gdp);dloggdp = diff(loggdp);实质性的%dcpi = diff(DataTable.cpiaucsl);实质性的%numObs=长度(dlogGDP);gdp=dlogGDP(1:15年底);%估计样本cpi = 3(1:长达15);T =长度(gdp);有效样本量frstHzn = T + 1: numObs;%预测地平线Hocpi = DCPI(FRSTHZN);%抵抗样本dts=日期(2:结束);%date nummbers.

适合ARMA(1,1)错误的回归模型。

mdl = regarima('arlags', 1“MALags”1);EstMdl =估计(Mdl、国内生产总值'X'cpi);
1.1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)1)误差模型误差模型误差模型误差模型(1)误差模型(1)误差模型(1)误差(1)误差模型(1)误差模型(高斯(1)误差模型(高斯分布:1)误差模型(高斯分布:1)误差模型(高斯分布:1)误差模型(高斯分布:1)误差模型(高斯分布:1)误差模型(高斯分布:1)误差模型(高斯分布:1)误差:1)误差:1)误差:1)误差:1)误差:贝塔(1)0.0028972 0.0013989 2.071 0.038355差异9.5734e-05 6.5562e-06 14.602 2.723e-48

预测未来15个季度的GDP增长率。使用估计样本作为预测的前样。

[gdpF,gdpMSE]=预测(EstMdl,15,“Y0”,本地生产总值,...“X0”,消费物价指数,'xf', hoCPI);

绘制预测和95%的预测间隔。

图1 = plot(dts(end-65:end),dlogGDP(end-65:end),...“颜色”,[7,7,7]);日期勾选保留h2 =情节(gdpF dts (frstHzn),“b”“线宽”2);h3 =情节(dts (frstHzn) gdpF + 1.96 * sqrt (gdpMSE),'r:'...“线宽”2);情节(dts (frstHzn) gdpf - 1.96 * sqrt (gdpMSE),'r:'“线宽”,2);ha=gca;标题([“{\bf预报和大约95%}”...“{\bf GDP率预测区间}”])ph=贴片([repmat(dts(frstHzn(1)),1,2)repmat(dts(frstHzn(end)),1,2)],...(公顷。YLim fliplr(ha.YLim)],...[0 0 0 0],“b”); ph.FaceAlpha=0.1;图例([h1 h2 h3]{“实际GDP率”'预测GDP率'...'95%预测间隔'},'地点'“最佳”“自动更新”“关闭”);轴线持有离开

图中包含一个轴对象。坐标轴对象与标题空白F o r e c s t s空白n d p p r o x我m t e空白空白9 5% F o r e c s t空白我n v t e r l s空白F o r空白G d p r t e包含5线类型的对象,补丁。这些对象分别代表观测GDP率、预测GDP率、95%预测区间。

使用误差为ARIMA(1,1,1)的回归模型预测单位根非平稳,对GDP进行对数预测,包括CPI作为预测因子和已知截距。

加载U.S.宏观经济数据集并预处理数据。

负载Data_USEconModel;numObs=length(DataTable.GDP);logGDP=log(DataTable.GDP(1:end-15));cpi=DataTable.CPIAUCSL(1:end-15);T=length(logGDP);有效样本量frstHzn = T + 1: numObs;%预测地平线hoCPI = DataTable.CPIAUCSL (frstHzn);%抵抗样本

指定估计期间的模型。

mdl = regarima('arlags', 1“MALags”, 1“D”1);

在有集成误差的模型中,截距是不可识别的,所以在估计前先确定它的值。一种方法是用简单线性回归估计截距。

Reg4Int = [oon(t,1),cpi] \ loggdp;拦截= reg4int(1);

考虑使用拦截网格执行敏感性分析。

设置截距,用ARIMA(1,1,1)误差拟合回归模型。

mdl.intercept =截距;Estmdl =估计(MDL,LOGGDP,'X',消费物价指数,...“显示”“关闭”
EstMdl=regARIMA,属性:Description:“ARIMA(1,1,1)误差模型(高斯分布)”分布:Name=“Gaussian”截距:5.80142 Beta:[0.00396703]P:2d:1q:1ar:{0.922717}滞后[1]SAR:{}MA:{-0.387864}滞后[1]SMA:{}方差:0.000108944回归ARIMA(1,1,1)误差模型(高斯分布)

预测未来15个季度的GDP增长。使用估计样本作为预测的前样。

[gdpF,gdpMSE]=预测(EstMdl,15,“Y0”logGDP,...“X0”,消费物价指数,'xf', hoCPI);

绘制预测和95%的预测间隔。

图H1 = plot(日期(结束-65:结束),log(dataTable.gdp(ex-65:结束)),...“颜色”,[7,7,7]);日期勾选保留h2 =情节(gdpF日期(frstHzn),“b”“线宽”h3=绘图(日期(frstHzn),gdpF+1.96*sqrt(gdpMSE),'r:'...“线宽”2);情节(日期(frstHzn) gdpf - 1.96 * sqrt (gdpMSE),'r:'...“线宽”,2);ha=gca;标题([“{\bf预报和大约95%}”...“{\bf GDP对数预测区间}”]);ph=斑块([repmat(日期(frstHzn(1)),1,2)repmat(日期(frstHzn(结束)),1,2)],...(公顷。YLim fliplr(ha.YLim)],...[0 0 0 0],“b”); ph.FaceAlpha=0.1;图例([h1 h2 h3]{观察到国内生产总值的“预测GDP”...'95%预测间隔'},'地点'“最佳”“自动更新”“关闭”);轴线持有离开

图中包含一个axes对象。标题为blank F r e c a s t s blank和blank a p r o x i m a t e blank 9 5%blank F r e c a s t e r v a l s blank F o r o g blank g d p的axes对象包含5个类型为line、patch的对象。这些对象表示观察到的GDP、预测的GDP、95%的预测区间。

无条件的干扰, u t ,是非平稳的,因此预测区间的宽度随时间增长。

更多关于

全部展开

算法

  • 预报计算预测的响应mses,YMSE,通过处理预测数据矩阵(X0XF)在非迅速且统计上独立于模型创新。所以,YMSE反映了与ARIMA误差模型的无条件扰动相关的方差。

  • 预报使用Y0X0来推断U0。因此,如果您指定U0预报忽略了Y0X0

参考文献

[1] Box, G. E. P. G. M. Jenkins和G. C. Reinsel。时间序列分析:预测与控制.3版。恩格尔伍德悬崖,NJ: Prentice Hall, 1994。

[2] 戴维森,R.和J.G.麦金农。计量经济学理论与方法英国牛津:牛津大学出版社,2004年。

恩德斯[3],W。应用计量经济时间序列新泽西州霍博肯:约翰·威利父子公司,1995年。

[4] 汉密尔顿,J.D。时间序列分析.普林斯顿:普林斯顿大学出版社,1994。

[5] 潘克拉茨,A。用动态回归模型进行预测。John Wiley & Sons, Inc, 1991。

Tsay, r.s。金融时间序列分析.第二辑。Hoboken,NJ:2005年John Wiley&Sons,Inc。