이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。
다변량선형회귀
서로다른절편을가지면서동일한기울기를갖는다고가정하고다변량회귀모델을패널데이터에피팅합니다。
표본데이터를불러옵니다。
负载(“流感”)
数据集형배열流感
는谷歌®쿼리데이터를기반으로하는CDC의전국독감추정값과9개개별지역의추정값을포함합니다。
응답변수와예측변수데이터를추출합니다。
Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;
Y
9개의응답변수는지역의독감추정값입니다。1년동안의매주별관측값이존재하므로
= 52입니다。응답변수의차원은지역에대응되므로
= 9입니다。x
의예측변수는주별전국독감추정값입니다。
독감데이터를지역별로그룹화하여플로팅합니다。
图;区域= flu.Properties.VarNames (2: end-1);情节(x, Y,“x”)传说(地区,“位置”,“西北”)
다변량회귀모델 를피팅합니다。여기서 이고 이며지역간동시상관관계 를가집니다。
9개의절편항과1개의공통된기울기를가지므로추정할회귀계수의개수
= 10입니다。입력인수X
는
×
크기의설계행렬로구성된요소를
개가진셀형배열이어야합니다。
X =细胞(n, 1);为i = 1:n X{i} = [eye(d) repmat(X (i),d,1)];结束(β,σ)= mvregress (X, Y);
β
는
차원계수벡터
의추정값을다음과같이포함합니다。
σ
는지역간동시상관관계에대한
×
분산——공분산행렬
(
)의추정값을포함합니다。
피팅된회귀모델을플로팅합니다。
B =[β(1:d); repmat(β(结束),1 d)];xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);为I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”));结束传奇(地区,“位置”,“西北”);
플롯을통해각회귀선이절편은서로다르지만기울기는동일함을알수있습니다。시각적으로검토해보면일부회귀선이다른회귀선보다데이터를더잘피팅하는것으로보입니다。
서로다른절편과기울기를갖는다고가정하고최소제곱을사용하여다변량회귀모델을패널데이터에피팅합니다。
표본데이터를불러옵니다。
负载(“流感”);
数据集형배열流感
는谷歌®쿼리를기반으로하는CDC의전국독감추정값과9개개별지역의추정값을포함합니다。
응답변수와예측변수데이터를추출합니다。
Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;
Y
9개의응답변수는지역의독감추정값입니다。1년동안의매주별관측값이존재하므로
= 52입니다。응답변수의차원은지역에대응되므로
= 9입니다。x
의예측변수는주별전국독감추정값입니다。
다변량회귀모델 를피팅합니다。여기서 이고 이며지역간동시상관관계 를가집니다。
9개의절편항과9개의기울기항을가지므로추정할회귀계수의개수
= 18입니다。X
는
×
설계행렬로구성된요소를
개가진셀형배열입니다。
X =细胞(n, 1);为i = 1:n X{i} = [eye(d) X (i)*eye(d)];结束(β,σ)= mvregress (X, Y,“算法”,“cwls”);
β
는
차원계수벡터
의추정값을다음과같이포함합니다。
피팅된회귀모델을플로팅합니다。
B =[β(1:d);β(d + 1:结束)');xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);为I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”));结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”,“西北”);
플롯을통해각회귀선이서로다른절편과기울기를가짐을알수있습니다。
모든응답변수차원에대해단일 × 설계행렬을사용하여다변량회귀모델을피팅합니다。
표본데이터를불러옵니다。
负载(“流感”)
数据集형배열流感
는谷歌®쿼리를기반으로하는CDC의전국독감추정값과9개개별지역의추정값을포함합니다。
응답변수와예측변수데이터를추출합니다。
Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;
Y
9개의응답변수는지역의독감추정값입니다。1년동안의매주별관측값이존재하므로
= 52입니다。응답변수의차원은지역에대응되므로
= 9입니다。x
의예측변수는주별전국독감추정값입니다。
×
설계행렬X
를만듭니다。회귀에상수항을포함시키기위해1로구성된열을추가합니다。
X =[(大小(X)), X);
다음과같은다변량회귀모델을피팅합니다。
여기서 이고 이며,다음과같은지역간동시상관관계가존재합니다。
9개의절편항과9개의기울기항을가지므로추정할회귀계수는18개입니다。
[β,σ,E, CovB logL] = mvregress (X, Y);
β
는
×
계수행렬의추정값을포함합니다。σ
는지역간동시상관관계에대한
×
분산——공분산행렬의추정값을포함합니다。E
는잔차로구성된행렬입니다。CovB
는회귀계수의추정된분산——공분산행렬입니다。logL
은마지막반복후의로그가능도목적함수값입니다。
피팅된회귀모델을플로팅합니다。
B =β;xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图h = plot(x,Y,“x”xx,适合“- - -”);为I = 1:d集合(h(d+ I))“颜色”get (h(我),“颜色”))结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”,“西北”)
플롯을통해각회귀선이서로다른절편과기울기를가짐을알수있습니다。
X
- - - - - -설계행렬다변량회귀에대한설계행렬로,행렬또는행렬로구성된셀형배열로지정됩니다。n은데이터에있는관측값개수이고,K는추정할회귀계수의개수이고,p는예측변수의개수이고,d는응답변수행렬Y
에있는차원수입니다。
d = 1인경우X
를단일n×K설계행렬로지정하십시오。
d > 1이고모든d개의차원이동일한설계행렬을갖는경우X
를(셀형배열에포함되지않은)단일n×p설계행렬로지정할수있습니다。
d > 1이고모든n개의관측값이동일한설계행렬을갖는경우X
를단일d×K설계행렬을포함하는셀형배열로지정할수있습니다。
n d > 1이고개의관측값이동일한설계행렬을갖지않는경우X
를d×K설계행렬을포함하는길이가n인셀형배열로지정하십시오。
회귀모델에상수항을포함시키려면각설계행렬이1로구성된열을포함해야합니다。
mvregress
는X
에있는南
값을누락값으로처리하고X
에서누락값이있는행을무시합니다。
데이터형:单
|双
|细胞
Y
- - - - - -응답변수응답변수로,n×d행렬로지정됩니다。n은데이터에있는관측값개수이고,d는응답변수에있는차원수입니다。d = 1이면mvregress
는Y
에있는값을n개의독립된응답변수값처럼처리합니다。
mvregress
는Y
에있는南
값을누락값으로간주하고이름——값쌍의인수算法
을사용하여지정된추정알고리즘에따라처리합니다。
데이터형:单
|双
선택적으로名称,值
인수가쉼표로구분되어지정됩니다。여기서的名字
은인수이름이고价值
는대응값입니다。的名字
은따옴표안에표시해야합니다。Name1, Value1,…,的家
과같이여러개의이름——값쌍의인수를어떤순서로든지정할수있습니다。
“算法”、“cwls’,‘covar0’,C
는공분산행렬C
를사용하는공분산가중최소제곱추정을지정합니다。
算法
- - - - - -추정알고리즘“mvn”
|ecm的
|“cwls”
추정알고리즘으로,“算法”
과함께다음중하나가쉼표로구분되어지정됩니다。
“mvn” |
일반다변량정규최대가능도추정。 |
ecm的 |
ECM알고리즘을통한최대가능도추정。 |
“cwls” |
공분산가중최소제곱추정。 |
디폴트알고리즘은누락값의존재여부에따라달라집니다。
전체데이터의경우디폴트값은“mvn”
입니다。
南
으로표시되는누락값인응답이있으면표본크기가모든모수를추정하기에충분할경우디폴트값은ecm的
입니다。그렇지않을경우디폴트알고리즘은“cwls”
입니다。
참고
算法
의값이“mvn”
인경우mvregress
는추정전에누락응답변수값이있는관측값을제거합니다。
예:“算法”、“ecm的
beta0
- - - - - -회귀계수에대한초기추정값회귀계수에대한초기추정값으로,“beta0”
과함께K개의요소를가진벡터가쉼표로구분되어지정됩니다。디폴트값은0으로구성된벡터입니다。
추정算法
이“mvn”
이면beta0
인수는사용되지않습니다。
covtype
- - - - - -분산——공분산행렬유형“全部”
(디폴트값)|“对角线”
Y
에대해추정할분산——공분산행렬유형으로,“covtype”
과함께다음중하나가쉼표로구분되어지정됩니다。
“全部” |
모든d (d + 1) / 2개의분산——공분산요소를추정합니다。 |
“对角线” |
분산——공분산행렬의d개의대각선요소만추정합니다。 |
예:“covtype”、“对角线”
outputfcn
- - - - - -각반복에서평가할함수각반복에서평가할함수로,“outputfcn”
과함께함수핸들이쉼표로구분되어지정됩니다。함수는논리값真正的
또는假
를반환해야합니다。각반복에서mvregress
는함수를평가합니다。결과가真正的
인경우반복이중지됩니다。그렇지않은경우계속반복됩니다。예를들어,현재반복결과를플로팅하거나표시하고,图를닫는경우真正的
를반환하는함수를지정할수있습니다。
함수는다음과같은순서로3개의입력인수를받아야합니다。
현재계수추정값으로구성된벡터
다음과같은3개의필드를포함하는구조체:
柯伐合金 |
분산——공분산행렬의현재값 |
迭代 |
현재반복횟수 |
fval |
로그가능도목적함수의현재값 |
다음과같은3개의값을받는텍스트
“init” |
함수가초기화중에호출된경우 |
“通路” |
함수가하나의반복후에호출된경우 |
“完成” |
함수가완료후에호출된경우 |
tolbeta
- - - - - -회귀계수에대한수렴허용오차sqrt (eps)
(디폴트값)|양의스칼라값tolobj
- - - - - -로그가능도목적함수에대한수렴허용오차eps ^ (3/4)
(디폴트값)|양의스칼라값vartype
- - - - - -모수추정을위한분산——공분산행렬유형“海赛”
(디폴트값)|“雪”
모수추정을위한분산——공분산행렬유형으로,“vartype”
과함께“海赛”
또는“雪”
가쉼표로구분되어지정됩니다。
값이“海赛”
인경우mvregress
는헤세관(측된정보)행렬을사용하여CovB
를계산합니다。
값이“雪”
인경우mvregress
는전체데이터피셔(예상된정보)행렬을사용하여CovB
를계산합니다。
“海赛”
방법은누락데이터로인해증가한불확실성을고려하는반면“雪”
방법은이를고려하지않습니다。
예:“vartype”、“费雪的
β
——추정된회귀계수추정된회귀계수로,열벡터또는행렬로반환됩니다。
logL
- - - - - -로그가능도목적함수값마지막반복후의로그가능도목적함수값으로,스칼라값으로반환됩니다。
다변량정규회귀는예측변수의설계행렬을토대로한d차원응답변수의회귀로,정규분포된오차를갖습니다。오차는이분산성(异方差的)이고상관관계가있을수있습니다。
이모델은다음과같습니다。
여기서
는응답변수로구성차된d원벡터입니다。
는예측변수의설계행렬입니다。
는회귀계수로구성된벡터또는행렬입니다。
는오차항으로구성차된d원벡터로,다음과같은다변량정규분포를갖습니다。
기대값/조건부최대화(ecm的
)및공분산가중최소제곱(“cwls”
)추정알고리즘은누락응답변수값을대치합니다。
가누락된관측값을나타낸다고하겠습니다。조건부대치값 는관측된데이터를기반으로한누락된관측값의기대값입니다。
누락된응답변수와관측된응답변수의결합분포는다음과같은다변량정규분포입니다。
조건부대치기대값을다변량정규분포의속성을사용하여다음식으로구할수있습니다。
참고
mvregress
는누락응답변수값만대치합니다。설계행렬에서누락값이있는관측값은제거됩니다。
[1] Little, Roderick J. A.和Donald B. Rubin。《缺失数据的统计分析》,第2版,霍博肯:约翰·威利父子公司,2002。
[2]孟,小李,唐纳德·鲁宾。“通过ECM算法的最大似然估计。”生物统计学。第80卷,第2期,1993年,267-278页。
塞克斯顿,乔,斯文森。《以EM速度收敛的ECM算法》。第87卷第3期,2000年,第651-662页。
登普斯特,a.p., n.m.莱尔德,D. B.鲁宾。“通过EM算法从不完整数据得到的最大似然”。皇家统计学会杂志。B系列,第39卷,第1期,1977年,第1 - 37页。
다음MATLAB명령에해당하는링크를클릭했습니다。
명령을실행하려면MATLAB명령창에입력하십시오。웹브라우저는MATLAB명령을지원하지않습니다。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。