这个例子展示了如何执行面板数据分析mvregress
.首先,具有并发相关性的固定效果模型由普通的最小二乘(OLS)符合某些面板数据。然后,估计的错误协方差矩阵用于获取面板纠正的回归系数的标准错误。
加载样本面板数据。
负载panelData
数据数组,panelData
,包含了对8个城市六年的年度观察。这是模拟数据。
第一个变量,增长
,衡量经济增长(反应变量)。第二个和第三个变量分别是城市和年份指标。最后一个变量,雇佣
,衡量就业(预测变量)。
y = panelData.Growth;城市= panelData.City;年= panelData.Year;x = panelData.Employ;
为了寻找潜在的特定城市的固定效应,创建一个按城市分组的响应方框图。
图()箱线图(y,市)包含(“城市”)
各城市的平均反应似乎没有任何系统性差异。
为了寻找潜在的特定年份的固定效应,创建一个按年份分组的响应方框图。
图()箱线图(y)包含(“年”)
有证据表明,不同年份的平均反应存在系统性差异。
让yij表示对city的响应j= 1,…,d年,我= 1,…,n.同样的,xij为预测变量对应的值。在这个例子中,n= 6d= 8。
考虑拟合一个特定年份的固定效应模型,该模型具有恒定的斜率和同一年份城市间的并发相关性,
在哪里 .并发关联占任何可能对某些城市影响增长的未测量,时间静态因素。例如,具有近距离空间接近的城市可能更有可能具有类似的经济增长。
来适应这个模型mvregress
,将响应数据重塑为n——- - - - - -d矩阵。
n = 6;d = 8;Y =重塑(Y、n、d);
创造一个长度 -n单元阵列的d——- - - - - -K设计矩阵。对于这个模型,有K= 7个参数(d= 6个拦截术语和斜率)。
设参数向量排列为
在这种情况下,第1年的第一个设计矩阵看起来像
和第二年的第二个设计矩阵看起来像
其余4年的设计矩阵是类似的。
K = 7;N = N * d;X =细胞(n, 1);为i = 1:n x0 =零(d,k-1);X0(:,i)= 1;x {i} = [x0,x(i:n:n)];结束
用普通最小二乘(OLS)拟合模型。
[b,sig,e,v] = mvregress(x,y,“算法”,“cwls”);b
B = 41.6878 26.1864 -64.5107 11.0924 -59.1872 71.3313 4.9525
xx = linspace(最小(x)最大(x));axx = repmat (b (1: k - 1), 1,长度(xx));bxx = repmat (b (K) * xx, n, 1);Yhat = axx + bxx;figure() hPoints = gscatter(x,y,year);持有上hlines = plot(xx,yhat);为i = 1:n set(hlines(i),“颜色”,得到(HPOINTS(i),“颜色”));结束持有从
具有特定年份截距和共同斜率的模型似乎与数据吻合得很好。
绘制残差,按年分组。
图()gscatter (E(:),市)ylabel (“残差”)
残差图表明存在并发相关性。例如,城市1、城市2、城市3和城市4在任何一年都是高于或低于平均水平的。对于城市5、6、7和8的集合也是如此。从探索图中可以看出,不存在系统性的城市特异性效应。
利用估计误差方差-协方差矩阵计算回归系数的面板校正标准误差。
xx = cell2mat(x);s = kron(眼睛(n),sig);vpcse = inv(xx'* xx)* xx'* s * xx * inv(xx'* xx);se = sqrt(diag(vpcse))
SE = 9.3750 8.6698 9.3406 9.4286 9.5729 8.8207 0.1527 0.1527