多元线性回归
拟合多元回归模型的面板数据,假设不同截距和共同的斜率。
加载示例数据。
负载(“流感”)
数据集的数组流感
包含国家疾控中心流感估计,以及9个独立的区域估计,基于谷歌®查询数据。
提取响应和预测器数据。
Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;
的反应Y
是9个地区流感估计在一年的时间里每周都有观测,所以
= 52。响应的维度对应于区域,所以
= 9。的预测因素x
是每周的全国流感估计
绘制流感数据,按地区分组。
图;区域= flu.Properties.VarNames (2: end-1);情节(x, Y,“x”)传说(地区,“位置”,“西北”)
拟合多元回归模型 ,在那里 和 ,区域间并行相关 .
有
= 10个回归系数估计:9个截距项和一个共同的斜率。输入参数X
应该是一个
-element cell数组
——- - - - - -
设计矩阵。
X =细胞(n, 1);为i = 1:n X{i} = [eye(d) repmat(X (i),d,1)];结束(β,σ)= mvregress (X, Y);
β
包含
维系数向量
.
σ
包含
——- - - - - -
variance-covariance矩阵
,
用于区域间并发相关性。
绘制拟合的回归模型。
B =[β(1:d); repmat(β(结束),1 d)];xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);为I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”));结束传奇(地区,“位置”,“西北”);
该图显示,每条回归线的截距不同,但斜率相同。在目视检查时,有些回归线似乎比其他回归线更适合数据。
用最小二乘拟合多元回归模型到面板数据,假设不同的截距和斜率。
加载示例数据。
负载(“流感”);
数据集的数组流感
包含国家疾病预防控制中心的流感估计,以及9个独立的区域估计基于谷歌®查询。
提取响应和预测器数据。
Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;
的反应Y
是9个地区流感估计在一年的时间里每周都有观测,所以
= 52。响应的维度对应于区域,所以
= 9。的预测因素x
是每周的全国流感估计
拟合多元回归模型 ,在那里 和 ,区域间并行相关 .
有
= 18个回归系数估计:9个截距项和9个斜率项。X
是一个
-element cell数组
——- - - - - -
设计矩阵。
X =细胞(n, 1);为i = 1:n X{i} = [eye(d) X (i)*eye(d)];结束(β,σ)= mvregress (X, Y,“算法”,“cwls”);
β
包含
维系数向量
.
绘制拟合的回归模型。
B =[β(1:d);β(d + 1:结束)');xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);为I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”));结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”,“西北”);
该图显示,每条回归线有不同的截距和斜率。
拟合多元回归模型使用单一 ——- - - - - - 所有响应维度的设计矩阵。
加载示例数据。
负载(“流感”)
数据集的数组流感
包含国家疾病预防控制中心的流感估计,以及9个独立的区域估计基于谷歌®查询。
提取响应和预测器数据。
Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;
的反应Y
是9个地区流感估计在一年的时间里每周都有观测,所以
= 52。响应的维度对应于区域,所以
= 9。的预测因素x
是每周的全国流感估计
创建一个
——- - - - - -
设计矩阵X
.添加一列“1”以在回归中包含常数项。
X =[(大小(X)), X);
拟合多元回归模型
在哪里 和 ,区域间并行相关
有18个回归系数需要估计:9个截距项和9个斜率项。
[β,σ,E, CovB logL] = mvregress (X, Y);
β
包含
——- - - - - -
系数矩阵。σ
包含
——- - - - - -
区域间并发相关性的方差-协方差矩阵。E
是残差矩阵。CovB
为回归系数的估计方差-协方差矩阵。logL
为最后一次迭代后对数似然目标函数的值。
绘制拟合的回归模型。
B =β;xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图h = plot(x,Y,“x”xx,适合“- - -”);为I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”))结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”,“西北”)
该图显示,每条回归线有不同的截距和斜率。
X
- - - - - -设计矩阵为多元回归设计矩阵,指定为矩阵或矩阵单元阵列。n为数据中观测的次数,K为需要估计的回归系数个数,p是预测变量的数量,和d是响应变量矩阵的维数吗Y
.
如果d= 1,然后指定X
作为一个单独的n——- - - - - -K设计矩阵。
如果d> 1和全部d尺寸有相同的设计矩阵,然后你可以指定X
作为一个单独的n——- - - - - -p设计矩阵(不在单元格数组中)。
如果d> 1和全部n观察有相同的设计矩阵,然后你可以指定X
作为单元格数组包含单个d——- - - - - -K设计矩阵。
如果d> 1和全部n观察结果没有相同的设计矩阵,则说明X
作为一个长度单元格数组n包含d——- - - - - -K设计矩阵。
要在回归模型中包含一个常数项,每个设计矩阵应该包含一列1。
mvregress
对待南
值X
作为缺少的值,并忽略行X
用缺失值。
数据类型:单
|双
|细胞
Y
- - - - - -响应变量响应变量,指定为n——- - - - - -d矩阵。n是数据中观察到的次数,和d是响应的维度数。当d= 1,mvregress
处理Y
就像n独立的响应值。
mvregress
对待南
值Y
作为缺失值,并根据使用名称-值对参数指定的估计算法处理它们算法
.
数据类型:单
|双
指定可选的逗号分隔的对名称,值
参数。的名字
参数名和价值
为对应值。的名字
必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家
.
“算法”、“cwls’,‘covar0’,C
指定协方差加权最小二乘估计使用协方差矩阵C
.
算法
- - - - - -估计算法“mvn”
|ecm的
|“cwls”
估计算法,指定为逗号分隔对组成“算法”
下面是其中之一。
“mvn” |
普通多元正态极大似然估计。 |
ecm的 |
基于ECM算法的最大似然估计。 |
“cwls” |
协方差加权最小二乘估计。 |
默认算法取决于缺失数据的存在。
对于完整数据,默认值为“mvn”
.
如果有任何缺少的响应(由南
),默认为ecm的
,前提是样本量足以估计所有参数。否则,默认算法为“cwls”
.
请注意
如果算法
的值“mvn”
,然后mvregress
在估计之前移除缺少响应值的观察值。
例子:“算法”、“ecm的
beta0
- - - - - -回归系数的初步估计初始估计的回归系数,指定为逗号分隔对组成“beta0”
一个向量K元素。默认值是一个0的向量。
的beta0
参数不使用,如果估计算法
是“mvn”
.
covtype
- - - - - -方差-协方差矩阵的类型“全部”
(默认)|“对角线”
估计的方差-协方差矩阵的类型Y
,指定为逗号分隔的对,由“covtype”
下面是其中之一。
“全部” |
估计所有d(d+ 1)/2方差-协方差元素。 |
“对角线” |
估计只有d方差-协方差矩阵的对角元素。 |
例子:“covtype”、“对角线”
outputfcn
- - - - - -函数来计算每个迭代函数在每次迭代时求值,指定为逗号分隔的对,由“outputfcn”
和一个函数句柄。函数必须返回一个逻辑真正的
或假
.在每一次迭代,mvregress
评估函数。如果结果是真正的
,迭代停止。否则,迭代继续。例如,您可以指定一个绘图或显示当前迭代结果并返回的函数真正的
如果你把图合上。
该函数必须接受三个输入参数,顺序如下:
向量的电流系数估计
包含这三个字段的结构:
柯伐合金 |
方差-协方差矩阵的当前值 |
迭代 |
当前迭代次数 |
fval |
对数似然目标函数的当前值 |
接受以下三个值的文本:
“init” |
当函数在初始化期间被调用时 |
“通路” |
当函数在迭代后被调用时 |
“完成” |
当函数在完成后被调用时 |
vartype
- - - - - -参数估计的方差-协方差矩阵的类型“海赛”
(默认)|“雪”
参数估计的方差-协方差矩阵的类型,指定为逗号分隔对,由“vartype”
,要么“海赛”
或“雪”
.
如果值为“海赛”
,然后mvregress
使用Hessian矩阵,或观察到的信息来计算CovB
.
如果值为“雪”
,然后mvregress
使用完整数据费雪,或期望信息矩阵来计算CovB
.
的“海赛”
方法考虑了由于缺失数据而增加的不确定性,而“雪”
方法不。
例子:“vartype”、“费雪的
β
-估计回归系数估计的回归系数,返回为列向量或矩阵。
如果您指定X
作为一个单独的n——- - - - - -K设计矩阵,然后mvregress
返回β
作为一个长度的列向量K.例如,如果X
是一个20乘5的设计矩阵吗β
是一个5 × 1的列向量。
如果您指定X
作为包含一个或多个的单元格数组d——- - - - - -K设计矩阵,然后mvregress
返回β
作为一个长度的列向量K.例如,如果X
那么,单元阵列是否包含2 × 10的设计矩阵呢β
是一个10 × 1的列向量。
如果您指定X
作为一个单独的n——- - - - - -p设计矩阵(不在单元格数组中),和Y
有尺寸d> 1,那么mvregress
返回β
作为一个p——- - - - - -d矩阵。例如,如果X
是一个20乘5的设计矩阵吗Y
有这样的二维空间吗d= 2,然后β
是一个5乘2的矩阵吗Y
值是X
×β
.
logL
-对数似然目标函数值最后一次迭代后的对数似然目标函数值,作为标量值返回。
多元正态回归是一元回归d具有正态分布误差的预测变量设计矩阵上的-维响应。误差可以是异方差的和相关的。
模型是
在哪里
是一个d-响应的维度向量。
是预测变量的设计矩阵。
为回归系数的向量或矩阵。
是一个d误差项的维向量,具有多元正态分布
期望/条件最大化(ecm的
)及协方差加权最小二乘(“cwls”
)估计算法包括缺失响应值的估算。
让 表示失踪的观察。条件输入值是给定观测数据的缺失观测值的期望值,
缺失响应和观测响应的联合分布为多元正态分布,
利用多元正态分布的性质,导出条件期望
请注意
mvregress
仅推断缺失的响应值。在设计矩阵中缺失值的观测值将被删除。
[1] Little, Roderick J. A.和Donald B. Rubin。缺失数据的统计分析.第2版,约翰·威利父子公司,2002。
[2]孟,小李,唐纳德·鲁宾。“通过ECM算法的最大似然估计。”生物统计学.第80卷,第2期,1993年,267-278页。
塞克斯顿,乔,斯文森。"以电磁速率收敛的电子对抗算法"生物统计学.第87卷第3期,2000年,第651-662页。
登普斯特,a.p., n.m.莱尔德,D. B.鲁宾。“通过EM算法从不完整数据得到的最大似然”。皇家统计学会杂志.B系列,第39卷,第1期,1977年,第1 - 37页。
您已经有了geänderte版本死亡Beispiels。Möchten您是谁? Änderungen öffnen?
您有一个连接到MATLAB-Befehl entspricht:
Führen Sie den Befehl durch Eingabe in das MATLAB-Befehlsfenster aus。Webbrowser unterstützen keine MATLAB-Befehle。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。