主要内容

mvregress

多元线性回归

描述

例子

β= mvregress (XY返回a的估计系数多元正态回归d维反应Y在设计矩阵中X

例子

β= mvregress (XY名称,值使用由一个或多个名称-值对参数指定的附加选项返回估计的系数。例如,您可以为回归指定估计算法、初始估计值或最大迭代次数。

例子

βσ) = mvregress (___也返回估计的d——- - - - - -dvariance-covariance矩阵Y,使用前面语法中的任何输入参数。

例子

βσECovBlogL) = mvregress (___也返回残差矩阵E,估计回归系数的方差-协方差矩阵CovB,最后一次迭代后的对数似然目标函数值logL

例子

全部折叠

拟合多元回归模型的面板数据,假设不同截距和共同的斜率。

加载示例数据。

负载(“流感”

数据集的数组流感包含国家疾控中心流感估计,以及9个独立的区域估计,基于谷歌®查询数据。

提取响应和预测器数据。

Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;

的反应Y是9个地区流感估计在一年的时间里每周都有观测,所以 n = 52。响应的维度对应于区域,所以 d = 9。的预测因素x是每周的全国流感估计

绘制流感数据,按地区分组。

图;区域= flu.Properties.VarNames (2: end-1);情节(x, Y,“x”)传说(地区,“位置”“西北”

图中包含一个轴对象。axis对象包含9个类型为line的对象。这些对象代表NE, MidAtl, central, WNCentral, SAtl, ESCentral, wcentral, Mtn, Pac。

拟合多元回归模型 y j α j + β x j + ϵ j ,在那里 1 ... n j 1 ... d ,区域间并行相关 C O V ϵ j ϵ j σ j j

K = 10个回归系数估计:9个截距项和一个共同的斜率。输入参数X应该是一个 n -element cell数组 d ——- - - - - - K 设计矩阵。

X =细胞(n, 1);i = 1:n X{i} = [eye(d) repmat(X (i),d,1)];结束(β,σ)= mvregress (X, Y);

β包含 K 维系数向量 α 1 α 2 ... α 9 β

σ包含 d ——- - - - - - d variance-covariance矩阵 σ j d × d j 1 ... d 用于区域间并发相关性。

绘制拟合的回归模型。

B =[β(1:d); repmat(β(结束),1 d)];xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”));结束传奇(地区,“位置”“西北”);

图中包含一个轴对象。axis对象包含18个类型为line的对象。这些对象代表NE, MidAtl, central, WNCentral, SAtl, ESCentral, wcentral, Mtn, Pac。

该图显示,每条回归线的截距不同,但斜率相同。在目视检查时,有些回归线似乎比其他回归线更适合数据。

用最小二乘拟合多元回归模型到面板数据,假设不同的截距和斜率。

加载示例数据。

负载(“流感”);

数据集的数组流感包含国家疾病预防控制中心的流感估计,以及9个独立的区域估计基于谷歌®查询。

提取响应和预测器数据。

Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;

的反应Y是9个地区流感估计在一年的时间里每周都有观测,所以 n = 52。响应的维度对应于区域,所以 d = 9。的预测因素x是每周的全国流感估计

拟合多元回归模型 y j α j + β j x j + ϵ j ,在那里 1 ... n j 1 ... d ,区域间并行相关 C O V ϵ j ϵ j σ j j

K = 18个回归系数估计:9个截距项和9个斜率项。X是一个 n -element cell数组 d ——- - - - - - K 设计矩阵。

X =细胞(n, 1);i = 1:n X{i} = [eye(d) X (i)*eye(d)];结束(β,σ)= mvregress (X, Y,“算法”“cwls”);

β包含 K 维系数向量 α 1 α 2 ... α 9 β 1 β 2 ... β 9

绘制拟合的回归模型。

B =[β(1:d);β(d + 1:结束)');xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”));结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”“西北”);

图中包含一个轴对象。axis对象包含18个类型为line的对象。这些对象代表NE, MidAtl, central, WNCentral, SAtl, ESCentral, wcentral, Mtn, Pac。

该图显示,每条回归线有不同的截距和斜率。

拟合多元回归模型使用单一 n ——- - - - - - P 所有响应维度的设计矩阵。

加载示例数据。

负载(“流感”

数据集的数组流感包含国家疾病预防控制中心的流感估计,以及9个独立的区域估计基于谷歌®查询。

提取响应和预测器数据。

Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;

的反应Y是9个地区流感估计在一年的时间里每周都有观测,所以 n = 52。响应的维度对应于区域,所以 d = 9。的预测因素x是每周的全国流感估计

创建一个 n ——- - - - - - P 设计矩阵X.添加一列“1”以在回归中包含常数项。

X =[(大小(X)), X);

拟合多元回归模型

y j α j + β j x j + ϵ j

在哪里 1 ... n j 1 ... d ,区域间并行相关

C O V ϵ j ϵ j σ j j

有18个回归系数需要估计:9个截距项和9个斜率项。

[β,σ,E, CovB logL] = mvregress (X, Y);

β包含 P ——- - - - - - d 系数矩阵。σ包含 d ——- - - - - - d 区域间并发相关性的方差-协方差矩阵。E是残差矩阵。CovB为回归系数的估计方差-协方差矩阵。logL为最后一次迭代后对数似然目标函数的值。

绘制拟合的回归模型。

B =β;xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图h = plot(x,Y,“x”xx,适合“- - -”);I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”))结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”“西北”

图中包含一个轴对象。axis对象包含18个类型为line的对象。这些对象代表NE, MidAtl, central, WNCentral, SAtl, ESCentral, wcentral, Mtn, Pac。

该图显示,每条回归线有不同的截距和斜率。

输入参数

全部折叠

为多元回归设计矩阵,指定为矩阵或矩阵单元阵列。n为数据中观测的次数,K为需要估计的回归系数个数,p是预测变量的数量,和d是响应变量矩阵的维数吗Y

  • 如果d= 1,然后指定X作为一个单独的n——- - - - - -K设计矩阵。

  • 如果d> 1和全部d尺寸有相同的设计矩阵,然后你可以指定X作为一个单独的n——- - - - - -p设计矩阵(不在单元格数组中)。

  • 如果d> 1和全部n观察有相同的设计矩阵,然后你可以指定X作为单元格数组包含单个d——- - - - - -K设计矩阵。

  • 如果d> 1和全部n观察结果没有相同的设计矩阵,则说明X作为一个长度单元格数组n包含d——- - - - - -K设计矩阵。

要在回归模型中包含一个常数项,每个设计矩阵应该包含一列1。

mvregress对待X作为缺少的值,并忽略行X用缺失值。

数据类型:||细胞

响应变量,指定为n——- - - - - -d矩阵。n是数据中观察到的次数,和d是响应的维度数。当d= 1,mvregress处理Y就像n独立的响应值。

mvregress对待Y作为缺失值,并根据使用名称-值对参数指定的估计算法处理它们算法

数据类型:|

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“算法”、“cwls’,‘covar0’,C指定协方差加权最小二乘估计使用协方差矩阵C

估计算法,指定为逗号分隔对组成“算法”下面是其中之一。

“mvn” 普通多元正态极大似然估计。
ecm的 基于ECM算法的最大似然估计。
“cwls” 协方差加权最小二乘估计。

默认算法取决于缺失数据的存在。

  • 对于完整数据,默认值为“mvn”

  • 如果有任何缺少的响应(由),默认为ecm的,前提是样本量足以估计所有参数。否则,默认算法为“cwls”

请注意

如果算法的值“mvn”,然后mvregress在估计之前移除缺少响应值的观察值。

例子:“算法”、“ecm的

初始估计的回归系数,指定为逗号分隔对组成“beta0”一个向量K元素。默认值是一个0的向量。

beta0参数不使用,如果估计算法“mvn”

方差-协方差矩阵的初始估计,σ,指定为逗号分隔的对,由“covar0”对称的正定的,d——- - - - - -d矩阵。默认值是单位矩阵。

如果估计算法“cwls”,然后mvregress使用covar0为每次迭代的加权矩阵,而不改变它。

估计的方差-协方差矩阵的类型Y,指定为逗号分隔的对,由“covtype”下面是其中之一。

“全部” 估计所有dd+ 1)/2方差-协方差元素。
“对角线” 估计只有d方差-协方差矩阵的对角元素。

例子:“covtype”、“对角线”

估计算法的最大迭代次数,指定为逗号分隔对组成“麦克斯特”一个正整数。

迭代继续,直到估计在收敛容忍范围内tolbetatolobj或指定的最大迭代次数麦克斯特是达到了。如果两个tolbetatolobj是0,那么mvregress执行麦克斯特没有收敛测试的迭代。

例子:“麦克斯特”,50岁

函数在每次迭代时求值,指定为逗号分隔的对,由“outputfcn”和一个函数句柄。函数必须返回一个逻辑真正的.在每一次迭代,mvregress评估函数。如果结果是真正的,迭代停止。否则,迭代继续。例如,您可以指定一个绘图或显示当前迭代结果并返回的函数真正的如果你把图合上。

该函数必须接受三个输入参数,顺序如下:

  • 向量的电流系数估计

  • 包含这三个字段的结构:

    柯伐合金 方差-协方差矩阵的当前值
    迭代 当前迭代次数
    fval 对数似然目标函数的当前值

  • 接受以下三个值的文本:

    “init” 当函数在初始化期间被调用时
    “通路” 当函数在迭代后被调用时
    “完成” 当函数在完成后被调用时

回归系数的收敛容忍度,指定为逗号分隔对,由“tolbeta”和一个正标量值。

b t 表示迭代时系数向量的估计t, τ β 为指定的公差tolbeta.回归系数估计的收敛准则为

b t b t 1 < τ β K 1 + b t

在哪里K为长度 b t v 向量的范数是多少 v

迭代继续,直到估计在收敛容忍范围内tolbetatolobj或指定的最大迭代次数麦克斯特是达到了。如果两个tolbetatolobj是0,那么mvregress执行麦克斯特没有收敛测试的迭代。

例子:e-5 tolbeta, 1

对数似然目标函数的收敛容差,指定为逗号分隔对由“tolobj”和一个正标量值。

l t 表示迭代时对数似然目标函数的值t, τ 为指定的公差tolobj.目标函数的收敛准则为

| l t l t 1 | < τ 1 + | l t |

迭代继续,直到估计在收敛容忍范围内tolbetatolobj或指定的最大迭代次数麦克斯特是达到了。如果两个tolbetatolobj是0,那么mvregress执行麦克斯特没有收敛测试的迭代。

例子:e-5 tolobj, 1

参数估计方差-协方差矩阵格式,CovB,指定为逗号分隔的对,由“varformat”下面是其中之一。

“β” 只返回回归系数估计的方差-协方差矩阵,β
“全部” 返回两个回归系数估计值的方差-协方差矩阵,β,方差-协方差矩阵估计,σ

例子:“varformat”,“全部”

参数估计的方差-协方差矩阵的类型,指定为逗号分隔对,由“vartype”,要么“海赛”“雪”

  • 如果值为“海赛”,然后mvregress使用Hessian矩阵,或观察到的信息来计算CovB

  • 如果值为“雪”,然后mvregress使用完整数据费雪,或期望信息矩阵来计算CovB

“海赛”方法考虑了由于缺失数据而增加的不确定性,而“雪”方法不。

例子:“vartype”、“费雪的

输出参数

全部折叠

估计的回归系数,返回为列向量或矩阵。

  • 如果您指定X作为一个单独的n——- - - - - -K设计矩阵,然后mvregress返回β作为一个长度的列向量K.例如,如果X是一个20乘5的设计矩阵吗β是一个5 × 1的列向量。

  • 如果您指定X作为包含一个或多个的单元格数组d——- - - - - -K设计矩阵,然后mvregress返回β作为一个长度的列向量K.例如,如果X那么,单元阵列是否包含2 × 10的设计矩阵呢β是一个10 × 1的列向量。

  • 如果您指定X作为一个单独的n——- - - - - -p设计矩阵(不在单元格数组中),和Y有尺寸d> 1,那么mvregress返回β作为一个p——- - - - - -d矩阵。例如,如果X是一个20乘5的设计矩阵吗Y有这样的二维空间吗d= 2,然后β是一个5乘2的矩阵吗Y值是X×β

中响应的估计方差-协方差矩阵Y,返回为d——- - - - - -d方阵。

请注意

估计方差-协方差矩阵,σ,不是残差矩阵的样本协方差矩阵,E

拟合回归模型的残差,返回为n——- - - - - -d矩阵。

如果算法的值ecm的“cwls”,然后mvregress计算中缺失值对应的残差值Y作为两者的区别有条件地估算值以及拟合值。

请注意

如果算法的值“mvn”,然后mvregress在估计之前移除缺少响应值的观察值。

参数估计方差-协方差矩阵,返回为方阵。

  • 如果varformat的值“β”(默认)CovB系数估计的方差-协方差矩阵在吗β

  • 如果varformat的值“全部”,然后CovB组合估计的方差-协方差矩阵在吗βσ

最后一次迭代后的对数似然目标函数值,作为标量值返回。

更多关于

全部折叠

多元正态回归

多元正态回归是一元回归d具有正态分布误差的预测变量设计矩阵上的-维响应。误差可以是异方差的和相关的。

模型是

y X β + e 1 ... n

在哪里

  • y 是一个d-响应的维度向量。

  • X 是预测变量的设计矩阵。

  • β 为回归系数的向量或矩阵。

  • e 是一个d误差项的维向量,具有多元正态分布

    e V N d 0 Σ

有条件地估算值

期望/条件最大化(ecm的)及协方差加权最小二乘(“cwls”)估计算法包括缺失响应值的估算。

y ˜ 表示失踪的观察。条件输入值是给定观测数据的缺失观测值的期望值, Ε y ˜ | y

缺失响应和观测响应的联合分布为多元正态分布,

y ˜ y V N X ˜ β X β Σ y ˜ Σ y ˜ y Σ y y ˜ Σ y

利用多元正态分布的性质,导出条件期望

Ε y ˜ | y X ˜ β + Σ y ˜ y Σ y 1 y X β

请注意

mvregress仅推断缺失的响应值。在设计矩阵中缺失值的观测值将被删除。

参考文献

[1] Little, Roderick J. A.和Donald B. Rubin。缺失数据的统计分析.第2版,约翰·威利父子公司,2002。

[2]孟,小李,唐纳德·鲁宾。“通过ECM算法的最大似然估计。”生物统计学.第80卷,第2期,1993年,267-278页。

塞克斯顿,乔,斯文森。"以电磁速率收敛的电子对抗算法"生物统计学.第87卷第3期,2000年,第651-662页。

登普斯特,a.p., n.m.莱尔德,D. B.鲁宾。“通过EM算法从不完整数据得到的最大似然”。皇家统计学会杂志.B系列,第39卷,第1期,1977年,第1 - 37页。

介绍了R2006b