이번역번역이지는최신내용을담고담고않습니다않습니다。최신최신내용을영문영문으로여기를클릭클릭
선형회귀모델
线性模型
은피팅된선형회귀모델객체입니다。회귀모델은응답변수와예측변수사이의관계를설명합니다。선형회귀모델의선형성은예측변수계수의선형성을가리킵니다。
线性模型
객체의속성을사용하여피팅된선형회귀모델을사하십시오。객체속성에는계수추정값,요약요약,피팅방법및입력이터에대한정보가포함됩니다。객체함수를사용하여응답변수를하고선형회귀모델수정,평가및및화하십시오。
线性模型
객체는Fitlm.
또는stepwiselm
을사용하여생성할수있습니다。
Fitlm.
은고정된모델사양을사용하여선형회귀모델을데이터에피팅합니다。모델에서항을추가하거나제거하려면addTerms
,removeterms.
또는步
을사용하십시오。또는단계적선형회귀를사용하여모델을피팅하려면stepwiselm
을사용하십시오。
系数转移性
- - - - - -계수추정값으로구성된공분산행렬이속성은읽기전용입니다。
계수추정값으로구성된공분산행렬로,숫자형값으로구성된p×행렬로지정됩니다。p는피팅된모델에포함된계수의개수입니다。
자세한내용은系数标准错误和置信区间항목을참조하십시오。
데이터형:单身的
|双倍的
CoefficientNames
- - - - - -계수이름이속성은읽기전용입니다。
계수이름으로,각각대응되는항의이름을을포함하는문자형벡터로구성셀형배열로로지정지정된셀형배열로지정지정
데이터형:细胞
系数
- - - - - -계수값이속성은읽기전용입니다。
계수값으로,테이블로지정됩니다。系数
는각계수계수에대해대해의행과다음과같은같은열을포함
估计
- 추정된계수값
SE.
- 추정값의표준오차
Tstat.
0 -계수가인지를확인하는검정에대한t -통계량
p值
——t -통계량에대한p -값
계수계수에대해다른다른검정수행수행Anova.
(선형회귀모델만해당)또는colealt
를사용하십시오。계수계수추정값의의신뢰구간을coefCI
를사용하십시오。
이러한열열중하나하나를벡터로점표기법사용하여속성의요소요소를참조하여속성의의요소참조참조예를들어,다음과같이모델MDL.
에서추정된계수벡터를얻습니다。
beta = mdl.cofficients.Estimate
데이터형:桌子
NumCoefficients
- - - - - -모델계수의개수이속성은읽기전용입니다。
모델계수의개수로,양의정수로지정됩니다。NumCoefficients
는모델이랭크부족인경우0으로설정되는계수를포함합니다。
데이터형:双倍的
NumEstimatedCoefficients
- - - - - -추정된계수의개수이속성은읽기전용입니다。
모델에서추정된계수의개수로,양의정수로지정됩니다。NumEstimatedCoefficients
는모델항이랭크부족인경우0으로설정되는계수를포함하지하지하지하지。NumEstimatedCoefficients
는회귀에대한자유도입니다。
데이터형:双倍的
教育部
- - - - - -오차에대한자유도이속성은읽기전용입니다。
오차(잔차)에대한자유도로,관측관측값개수에서추정된계수를뺀값과같으며같으며개수뺀값과같으며같으며개수의정수로지정같으며
데이터형:双倍的
诊断
- - - - - -관측값진단이속성은읽기전용입니다。
관측값진단으로,각관측값에대해하나행과다음표에된열포함하는테테이블로테테블로지정
열 | 의미 | 설명 |
---|---|---|
利用 |
Hatmatrix. 의대각선요소 |
각관측값에대한利用 는관측된예측변수값에의해피팅이결정되는정도를나타냅니다。값이1 에가까우면피팅이다른관측관측값의영향을거의않고않고해당해당관측값의해결정됨을을값의해결정됨을값이0 에가까우면피팅이주로다른관측값에의해결정됨을나타냅니다。P 개의계수와N 개의관측값이있는모델모델의,利用 의평균값은P / N 입니다。2 * P / N 보다큰利用 값은높은지렛대값나타냅니다나타냅니다。 |
煮熟 |
쿡의거리 | 煮熟 는피팅된된값의의된변화량에대한대한측정값값煮熟 가평균쿡의거리(库克的距离)의세배보다큰관측값은이상값일수있습니다。 |
Dffits |
피팅된값의Delete-1스케일링된차분 | Dffits 。절댓값이2 * sqrt(p / n) 보다큰값은영향점으로간주될수있습니다。 |
S2_i |
删除-1분산 | S2_i 는각관측값을차례로삭제하여구한잔차분산추정값집합입니다。이러한추정값을MSE 속성에저장된평균제곱(MSE)값과비교할수。 |
科罗拉蒂奥 |
공분산행렬식의删除-1비율 | 科罗拉蒂奥 는전체모델에대한공분산행렬의행렬식에대해각관측값을차례로삭제한계수공분산행렬의행렬식비율입니다。1 + 3 * P / N 보다크거나1 - 3 * p / n 보다작은값은영향점나타냅니다나타냅니다。 |
dfbetas. |
계수추정값의Delete-1스케일링된차분 | dfbetas. 는는계수추정값값의스케일링된변화량으로구성N ×P 행렬로,각관측값을차례로제외시켜얻을수있습니다。절댓값이3 / sqrt(n) 보다보다값은관측이해당계수에미치는영향이크다는크다는을나타냅니다。 |
Hatmatrix. |
관측된응답변수에서装 를계산하기위한투영행렬 |
Hatmatrix. 는it pited = hatmatrix * y 를충족하는N ×N 행렬이며,여기여기Y 는응답변수벡터이고安装 는피팅된응답변수값으로구성된벡터입니다。 |
诊断
는이상값및영향관측값구하는데도움이되는정보를포함합니다。删除-1진단은피팅에서각값을차례제외제외얻은을을캡처합니다。자세한내용은帽子矩阵和杠杆,库克的距离및删除-1统计信息항목을참조하십시오。
관측값진단을플로팅하려면plotdiagnostics.
를사용하십시오。
결측값(观察invofo.missing.
에있음)또는제외된값(ObservationInfo.Excluded
에있음)으로인해피팅에사용되지않은행에는煮熟
,Dffits
,S2_i
,科罗拉蒂奥
열에南
값이포함포함利用
,dfbetas.
,Hatmatrix.
열에0이포함포함。
이러한열중하나를배열로얻으려면점표기법을사용하여속성의요소를참조하십시오。예를들어,다음과같이모델MDL.
에서Delete-1분산벡터를구합니다。
s2i = mdl.diagnostics.s2_i;
데이터형:桌子
安装
- - - - - -입력데이터를기준으로피팅된응답변수값이속성은읽기전용입니다。
입력데이터를기준으로피팅된(예측된)응답변수값으로,N×1숫자형벡터로지정됩니다。ñ은입력데이터에포함된관측값개수입니다。预测
를사용하여하여다른다른예측변수값에대한예측값을계산安装
에대한신뢰한계를계산할수있습니다。
데이터형:单身的
|双倍的
数似然
- - - - - -로그가능도.이속성은읽기전용입니다。
응답변수값의로그가능도로,각응답변수값이정규분포를따른다는가정에기반하여숫자형값으로지정됩니다。정규분포의평균은피팅된(예측된)응답변수값이고,분산은MSE
입니다。
데이터형:单身的
|双倍的
ModelCriterion
- - - - - -모델비교기준이속성은읽기전용입니다。
모델비교기준으로,다음필드를가진구조체로지정됩니다。
AIC.
-아카이케정보기준(AIC: Akaike信息准则)으로AIC = -2 * logL + 2 *米
입니다。여기서logl.
은로그가능도이며米
은추정된모수의개수입니다。
AICC.
- 표본표본크기에대해수정수정된아카케기준기준AICC = AIC +(2 * M *(M + 1))/(N - M - 1)
입니다。여기서n
은관측값개수입니다。
BIC
- 베이즈정보기준(BIC:Bayesian Information Criterion)으로BIC = -2 * logl + m * log(n)
입니다。
中安集团经贸
- 일관된아카이케정보기준으로caic = -2 * logl + m *(log(n)+ 1)
입니다。
정보기준은동일한데이터에에대한여러모델피팅을하는사용할할있는모델선택선택도구할있는모델선택도구도구이기준은복잡도(특히특히개수)에대한벌점을포함하는모델에가능도측정측정값입니다입니다。각기각기다른정보기준기준은형식으로구분구분
여러모델을비교할때는정보기준값이가장낮은모델이가장적합한피팅모델입니다。최적의피팅모델은모델비교에사용된기준에따라다를수있습니다。
기준값중하나를스칼라로구하려면점표기법을사용하여속성을참조하십시오。예를들어,다음과같이모델MDL.
에서aiC값另类投资会议
를구합니다。
AIC = mdl.modelcrertion.aic.
데이터형:结构体
MSE
- - - - - -평균제곱오차이속성은읽기전용입니다。
평균제곱오차(잔차)로,숫자형값으로지정。
MSE = SSE / DFE,
여기서mse는는제곱오차이고,sse는제곱오차의이며,dfe는자유도입니다。
데이터형:单身的
|双倍的
残差
- - - - - -피팅된모델의잔차이속성은읽기전용입니다。
피팅된모델의잔차로,각관측값에대해하나의행과다음표에설명된열을포함하는테이블로지정됩니다。
열 | 설명 |
---|---|
生 |
관측값에서피팅값을뺀값입니다。 |
皮尔逊 |
원시원시잔차를평균제곱오차의(RMSE)으로으로값입니다。 |
标准化 |
원시잔차를를잔차의의된표준편차로로나눈값값 |
Studentized |
원시잔차를잔차표준편차에대한독립적인추정값으로나눈값입니다。관측값我에대한잔차를관측값我를제외한모든관측값을기반으로하는오차표준편차의추정값으로나누어얻습니다。 |
잔차에대한플롯을생성하려면plotResiduals
를사용하십시오。자세한내용은残差항목을참조하십시오。
결측값(观察invofo.missing.
에있음)또는제외된값(ObservationInfo.Excluded
에있음)으로인해피팅에사용되지않은행에는南
값이포함포함。
이러한열열중하나하나를벡터로점표기법사용하여속성의요소요소를참조하여속성의의요소참조참조예를들어,다음과같이모델MDL.
에서원시잔차벡터r
을구합니다。
R = mdl.Residuals.Raw
데이터형:桌子
RMSE
- - - - - -평균제곱오차의제곱근이속성은읽기전용입니다。
평균제곱오차(잔차)의제곱근으로,숫자형값으로지정됩니다。
RMSE = SQRT(MSE),
여기서RMSE는평균제곱오차의제곱근이고MSE는평균제곱오차입니다。
데이터형:单身的
|双倍的
Rsquared
- - - - - -모델에대한결정계수값이속성은읽기전용입니다。
모델모델대한결정계수값,다음두필드를가지는구조체로구조체로지정。
普通的
- 일반(수정되지않은)결정계수
调整
- 계수개수에대해수정된결정계수
결정계수값은모델로설명되는총제곱합의비율입니다。일반결정계수값은SSR
속성및SST
속성과관련이있습니다。
Rsquared = SSR /风场
,
여기서SST
는총제곱합이고,SSR
은제곱의회귀합입니다。
자세한내용은결정계수(R제곱)항목을참조하십시오。
이러한값중하나를스칼라로얻으려면점표기법을사용하여속성을참조하십시오。예를들어,다음과같이모델MDL.
에서수정된결정계수값을구합니다。
r2 = mdl.rsquared.Adjusted.
데이터형:结构体
上交所
- - - - - -제곱오차의합이속성은읽기전용입니다。
제곱오차(잔차)의합으로,숫자형값으로지정됩니다。
피타고라스정리는다음을합니다합니다。
SST = SSE + SSR
,
여기서SST
는총제곱합이고,上交所
는제곱오차의합이고,SSR
은제곱의회귀합입니다。
데이터형:单身的
|双倍的
SSR
- - - - - -회귀제곱합이속성은읽기전용입니다。
회귀제곱합으로,숫자형값으로지정됩니다。제곱의회귀합은평균과피팅된값간의편차에대한제곱합과같습니다。
피타고라스정리는다음을합니다합니다。
SST = SSE + SSR
,
여기서SST
는총제곱합이고,上交所
는제곱오차의합이고,SSR
은제곱의회귀합입니다。
데이터형:单身的
|双倍的
SST
- - - - - -총제곱합이속성은읽기전용입니다。
총제곱합으로,숫자형값으로지정됩니다。총제곱합은意思是(y)
와응답변수벡터y
간의편차에대한같습니다같습니다。
피타고라스정리는다음을합니다합니다。
SST = SSE + SSR
,
여기서SST
는총제곱합이고,上交所
는제곱오차의합이고,SSR
은제곱의회귀합입니다。
데이터형:单身的
|双倍的
健壮的
- - - - - -로버스트피팅정보이속성은읽기전용입니다。
로버스트피팅정보로,다음표에설명된필드를가지는구조체로지정됩니다。
필드 | 설명 |
---|---|
WgtFun |
로버스트가중치함수。'bisquare' 를예로들수있습니다(“RobustOpts” 참조)。 |
调 |
조율상수。WgtFun 이'OLS' 이거나WgtFun 이디폴트조율가1인사용자지정가중치에에대한핸들인경우이필드는비어비어([] )。 |
权重 |
로버스트피팅의최종반복사용가중치로구성된벡터。CompactLinearModel. 객체의경우이필드는비어있습니다。 |
로버스트회귀를사용하여모델을생성하지않으면이구조체는비어있습니다。
데이터형:结构体
步骤
- - - - - -단계적피팅정보이속성은읽기전용입니다。
단계적피팅정보로,다음표에설명된필드를갖는구조체로지정됩니다。
필드 | 설명 |
---|---|
开始 |
시작모델을나타내는식 |
降低 |
하한모델을나타내는식。降低 의의항들은모델모델에서유지되어야되어야 |
上 |
상한모델을나타내는식。모델은上 보다더많은항을포함할수없습니다。 |
标准 |
단계별알고리즘에사용되는기준(예:“上世纪” ) |
p |
标准 이항을추가할분계점 |
PRemove |
标准 이항을제거할분계점 |
历史 |
피팅에서수행하는단계를나타내는테이블 |
历史
테이블은초기피팅을포함하여각단계에대해하나의행과다음표에설명된열을포함합니다。
열 | 설명 |
---|---|
行动 |
해당단계에서수행되는동작:
|
术语 |
|
术语 |
항행렬의모델照片 |
DF |
해당단계이후의회귀자유도 |
delDF |
이전단계에비해달라진회귀자유도의변화량(항을제거하는단계의경우음수임) |
异常 |
해당단계에서의이탈도,즉즉잔차(일반화일반화회귀모델해당해당) |
FSTAT |
해당단계로이어지는F- 통계량 |
pvalue. |
F——통계량의p——값 |
단계적회귀를사용하여모델을피팅하지않는한,구조체는비어있습니다。
데이터형:结构体
公式
- - - - - -모델정보LinearFormula
객체이속성은읽기전용입니다。
모델정보로,LinearFormula
객체로지정됩니다。
다음과같이점표기법을사용하여피팅된모델MDL.
의수식을표시합니다。
mdl.formula.
NumObservations
- - - - - -관측값개수이속성은읽기전용입니다。
피팅피팅가피팅피팅사용하는하는관측값,양의정수로지정。NumObservations
는원래테이블,데이터셋또는행렬에제공된관측값개수에서제외된행('排除'
이름 - 값쌍의인수로설정됨됨됨에이있는행을뺀값입니다。
데이터형:双倍的
numpredictors.
- - - - - -예측변수의개수이속성은읽기전용입니다。
모델을피팅하는데사용되는예측변수의개수로,양의정수로지정됩니다。
데이터형:双倍的
numvarialbles.
- - - - - -변수의개수이속성은읽기전용입니다。
입력입력이터에에포함되는되는의의의의의의의개수로의의의정수로정수로지정의의의정수로정수로지정numvarialbles.
는원래이블또는또는이터셋데포함된변수개수이거나예측예측예측행렬및변수벡터에포함된열개수개수입니다개수개수개수입니다개수개수입니다개수개수개수입니다개수개수개수개수개수개수개수개수개수개수개수개수개수개수개수개수총개수개수개수개수
numvarialbles.
는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。
데이터형:双倍的
ObservationInfo
- - - - - -관측값정보이속성은읽기전용입니다。
관측값정보로,n×4테이블로지정지정。여기서n은입력입력이터의의행개수와와。ObservationInfo
는다음표에설명된열을포함합니다。
열 | 설명 |
---|---|
权重 |
관측값가중치로,숫자형값으로지정됩니다。디폴트값은1 입니다。 |
排除 |
제외된관측값에대한표시자로,논리값으로지정됩니다。'排除' 이름——값쌍의인수를사용하여피팅에서관측값을제외한경우값은真的 입니다。 |
失踪 |
결측관측값에대한,논리값으로지정。관측값이결측된경우값은真的 입니다。 |
子集 |
피팅함수가관측값을사용하는지여부를나타내는표시자로,논리값으로지정됩니다。관측값이제외되지않거나결측되지않은경우,즉피팅함수가해당관측값을사용하는경우값은真的 입니다。 |
이러한열열중하나하나를벡터로점표기법사용하여속성의요소요소를참조하여속성의의요소참조참조예를들어,다음과같이모델MDL.
의가중벡터w
를구합니다。
w = mdl.observationInfo.weight.
데이터형:桌子
观察名称
- - - - - -관측값이름.이속성은읽기전용입니다。
관측값이름으로,피팅에사용되는값의이름을을포함하는문자형벡터로된셀형배열배열지정지정지정구성된셀형셀형배열지정지정
피팅이관측값이름을포함하는이블또는데이터셋을을기반으로으로하는观察名称
는이름을사용용。
그렇지않은경우观察名称
는빈셀형배열입니다。
데이터형:细胞
PredictorNames
- - - - - -모델모델피팅하는데사용되는예측변수의이름이속성은읽기전용입니다。
모델을피팅하는데사용되는예측변수의이름으로,문자형벡터로구성된셀형배열로지정됩니다。
데이터형:细胞
ResponseName
- - - - - -응답변수이름이속성은읽기전용입니다。
응답변수이름으로,문자형벡터로지정됩니다。
데이터형:char
VariableInfo
- - - - - -변수에대한정보이속성은읽기전용입니다。
变量
에에변수에변수로정보다음표에설명된열을갖는표에설명된정보갖는표에설명된정보정보포함포함된설명대한정보정보정보정보포함정보
열 | 설명 |
---|---|
班级 |
변수클래스로,문자형벡터로구성된셀형배열로지정됩니다(예:'双倍的' 및“绝对” )。 |
范围 |
변수변수범위,벡터로구성된셀형배열로지정됩니다。
|
InModel |
피팅된모델에어느변수가포함되었는지에대한표시자로,논리형벡터로지정됩니다。모델이변수를포함하는경우값은真的 입니다。 |
是基本的 |
범주형변수에대한표시자로,논리형벡터로지정됩니다。변수가범주형인경우값은真的 입니다。 |
VariableInfo
는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。
데이터형:桌子
variablenames.
- - - - - -변수의이름이속성은읽기전용입니다。
변수의이름으로,문자형벡터로구성된셀형배열로지정됩니다。
피팅이테테또는이터셋을기반으로경우이속성은해당해당이블에이터셋데의의이름을을제공제공제공제공제공제공
피팅이예측변수행렬과응답변수벡터를기반으로하는경우variablenames.
는피팅방법의'varnames'
이름——값쌍의인수로지정된값을포함합니다。'varnames'
의디폴트값은{'x1','x2',...,'xn','y'}
입니다。
variablenames.
는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。
데이터형:细胞
变量
- - - - - -입력데이터이속성은읽기전용입니다。
입력데이터로,테이블로지정됩니다。变量
는예측변수값과응답변수값을모두포함합니다。피팅이테이블또는数据集형배열을기반으로하는경우变量
는해당이블또는dataset형배열의모든이터를를포함。그렇지않은경우变量
는입력데이터행렬X
와응답변수벡터y
에서생성되는테이블입니다。
变量
는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。
데이터형:桌子
CompactLinearModel.
만들기袖珍的 |
紧凑线性回归模型 |
addTerms |
为线性回归模型添加术语 |
removeterms. |
从线性回归模型中移除术语 |
步 |
通过添加或移除术语来改进线性回归模型 |
Anova. |
方差分析线性回归模型 |
coefCI |
线性回归模型系数估计的置信区间 |
colealt |
线性回归模型系数线性假设检验 |
DWTest. |
线性回归模型对象的德宾-沃森检验 |
partialDependence |
计算部分依赖 |
阴谋 |
散点图或添加的线性回归模型的可变曲线 |
plotAdded |
添加了线性回归模型的可变曲线 |
plotAdjustedResponse |
线性回归模型调整后的响应图 |
plotdiagnostics. |
绘制线性回归模型的观察诊断图 |
plotEffects |
绘制预测因子在线回归模型的主要效果 |
plotInteraction |
在线性回归模型中绘制两个预测因子的交互作用 |
plotPartialDependence |
创建部分依赖图(PDP)和个人有条件期望(ICE)情节 |
plotResiduals |
线性回归模型的绘图残差 |
plotslice. |
通过回归系数的表面切片的情节 |
收集 |
从GPU中收集机器学习模型的属性 |
행렬입력이터세트를사용하여선형회귀모델을피팅합니다。
행렬입력데이터세트인carsmall
데이터세트세트를불러。
加载carsmallX =(重量、马力、加速度);
Fitlm.
을사용하여선형회귀모델을피팅합니다。
mdl = fitlm (X,英里/加仑)
mdl = Linear regression model: y ~ 1 + x1 + x2 + x3 Estimated Coefficients: Estimate SE tStat pValue __________ _________ _________ __________ (Intercept) 47.977 3.8785 12.37 4.8957e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742e-08 x2 -0.042943 0.024313 -1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236观测数:93、误差自由度:89均方根误差:4.09 r平方:0.752,校正r平方:0.744 f统计量与常数模型:90,p-value = 7.38e-27
모델표시화면에모델식,추정된계수및모델요약이포함됩니다。
표시된모델식Y〜1 + x1 + x2 + x3
은
에에합니다。
모델표시화면에系数
속성에저장된,추정된계수정보도표시됩니다。系数
속성을표시합니다。
mdl。系数
ANS =4×4表估计SE TSTAT p值__________ _________ _________ __________(截距)47.977 3.8785 12.37 4.8957e-21 X1 -0.0065416 0.0011274 -5.8023 9.8742e-08×2 -0.042943 0.024313 -1.7663 0.08078×3 -0.011583 0.19333 -0.059913 0.95236
系数
속성속성은다음과같은같은열을포함포함
估计
- 모델모델에서각각의의대응항에대한계수추정값값예예를,상수항(截距
)에대한추정값은47.977입니다。
SE.
- 계수의표준오차입니다。
Tstat.
- 모델모델에주어진다른다른예측변수를상정한,'대응하는계수가0이아니다'는대립가설에대해대해대해대해대해0다다다다다설설설을검정하는하는용된각계수에에t——통계량입니다。참고로,tStat =估计/ SE
입니다。예를들어,절편에대한t——통계량은47.977/3.8785 = 12.37입니다。
p值
0 -대응하는계수가인지아니면0이아닌지를검정하는가설에대한t——통계량의p- 값입니다。예를들어,X2
에대한t——통계량의p0.05 -값은보다크므로모델의다른항을고려할때이항은5%유의수준에서유의미하지않습니다。
모델의요약통계량은다음과같습니다。
观察数
- - - - - -南
값값을포함하지하지않는행개수개수예를들어,X
와MPG
의행개수는100개인데MPG
데이터벡터에南
값이6개있고马力
데이터벡터벡터에다른관측값에南
1개값이있기때문에观察数
93年는입니다。
错误自由度
- - - - - -n- - - - - -p이며,여기서n은관측값의개수이고p는절편을포함하여모델에포함된계수의개수입니다。예를들어,이모델은4개의예측변수를가지므로错误自由度
은93 - 4 = 89‰。
根均匀误差
- 평균제곱오차의제곱근으로,오차분포의표준편차를추정합니다。
r-平方
및调整后的R平方
- 각각결정계수와수정된계수계수를나타냅니다。예를들어,r-平方
값은모델이응답응답MPG
의변동성의약75%를설명한다는것을나타냅니다。
F统计与常量模型
- 회귀모델에대한F- 의검정으로,이모델이상수항만만으로구성된모델보다훨씬더잘피팅여부를검정검정되는지여부를검정
假定值
- 모델에대한F——검정의p- 값입니다。예를들어,이모델모델p- 값이7.3816e-27인경우유의미합니다。
모델속성(NumObservations
,教育部
,RMSE
및Rsquared
)에서,그리고Anova.
함수를사용하여이러한통계량을확인할수있습니다。
ANOVA(MDL,'概括')
ANS =3×5表SUMSQ DF MeanSq˚Fp值______ __ ______ __________总计6004.8 92 65.269型号4516 3 1505.3 89.987 7.3816e-27残1488.8 89 16.728
범주형예측변수를포함하는선형회귀모델을피팅합니다。모델에서기준기준레벨을제어하기위해범주형예측변수의를다시정렬정렬정렬를다시정렬정렬그런다음Anova.
를사용하여범주형변수의유의성을검정합니다。
범주형예측변수를갖는모델
carsmall
데이터세트를불러오고,MPG
의선형회귀모델을model_year.
의함수로생성합니다。숫자형벡터model_year.
를범주형변수로처리하기위해'pationalvars'
이름 - 값쌍의인수를사용하여예측변수를식별합니다。
加载carsmallmdl = fitlm(model_year,mpg,'pationalvars'1,'varnames',{'Model_Year',“英里”})
mdl =线性回归模型:MPG ~ 1 + Model_Year Estimated Coefficients: Estimate SE tStat pValue ________ ______ ______ __________ (Intercept) 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 3.8839 1.4059 2.7625 0.0069402 Model_Year_82 14.02 1.4369 9.7571 8.2164e-16观测数:94,误差自由度:91均方根误差:5.56 R-squared: 0.531, Adjusted R-squared: 0.521 F-statistic vs. constant model: 51.6, p-value = 1.07e-15
표시된모델식MPG〜1 + model_year
는다음에해당합니다。
,
여기서
및
는model_year.
의값이각각76및82일때값1인이표시변수입니다。model_year.
변수는3개의고유한을포함하고있으며,이는独特
함수를사용해서확인할수있습니다。
唯一的(Model_Year)
ans =3×170 76 82.
Fitlm.
은model_year.
에서가장작은값을기준레벨('70'
)로로선택하고두개의표시표시
과
를를합니다。모델이3개의표시변수(각레벨당1개)와1개의절편항을포함하는설계에이랭크부족이되므로부족부족이은은은
전체표시변수를갖는모델
MDL.
항의을절편항이없고3개의표시변수를모델로해석할수있습니다。
.
또는표시변수를수동으로생성하고모델식을지정하여절편항이없고3개의표시변수를갖는모델을생성할수도있습니다。
temp_year = dummyvar(分类(model_year));model_year_70 = temp_year(:,1);model_year_76 = temp_year(:,2);model_year_82 = temp_year(:,3);TBL =表(Model_year_70,model_year_76,model_year_82,mpg);mdl = fitlm(tbl,'mpg〜model_year_70 + model_year_76 + model_year_82 - 1')
MDL =线性回归模型:MPG〜Model_Year_70 + Model_Year_76 + Model_Year_82估计系数:估计SE TSTAT p值________ _______ ______ __________ Model_Year_70 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 21.574 0.95387 22.617 4.0156e-39 Model_Year_82 31.71 0.99896 31.743 5.2234e-51的数观察:94,误差自由度:91根均方误差:5.56
모델에서기준레벨선택하기
먼저범주형변수年
를만듭니다。
年=分类(model_year);
类别
함수를사용하여범주의순서를확인합니다。
类别(年)
ans =3x1细胞{'70'} {'76'} {'82'}
年
를예측변수로사용할경우Fitlm.
은첫번째범주'70'
을기준레벨로선택합니다。reordercats
함수를사용하여年
를다시정렬합니다。
Year_reordered = reordercats(一年,{“76”,'70','82'});类别(年份)
ans =3x1细胞{'76'} {'70'} {'82'}
Year_reordered
의첫번째범주는“76”
입니다。MPG
의선형회귀모델을Year_reordered
의함수로생성합니다。
mdl2 = fitlm (Year_reordered MPG,'varnames',{'Model_Year',“英里”})
MDL2 =线性回归模型:MPG〜1 + Model_year估计系数:估计SE TSTAT PVALUE ________ _______ ______________________________70 -3.8839 1.4059 -2.7620 0.136 1.3812 7.3385 8.7634E-11观察数目:94,误差自由度:91根均匀误差:5.56 R线:0.531,调整R线:0.521 F统计与常数型号:51.6,p值= 1.07e-15
mdl2
는“76”
을기준레벨로사용하고두개의표시변수
과
를포함합니다。
범주형예측변수평가하기
mdl2
의모델표시화면은대응되는계수가0인지여부를검정하기위해각항의p——값을포함합니다。각p- 값은각표시표시를를사합니다。범주형변수model_year.
를표시변수의그룹으로조사하려면Anova.
를사용하십시오。모델모델의상수항을을제외각변수에대해분산분석통계량을포함하는성분성분분산반환반환“组件”
(디폴트값)옵션을사용합니다。
ANOVA(MDL2,“组件”)
ANS =2×5表SUMSQ DF MeanSq˚Fp值______ __ ______ _____ __________ Model_Year 3190.1 2 1595.1 51.56 1.0694e-15错误2815.2 91 30.936
성분분산분석표는표시변수의p- 값보다작은model_year.
변수의p——값을포함합니다。
시멘트조성물이해당시멘트의경화열에미치는영향을측정하는哈尔德
데이터세트세트를불러。
加载哈尔德
이데이터세트는변수配料
와热
를포함합니다。행렬配料
는는에존재하는가지화학성분의조성비율을포함합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다포함포함포함합니다포함포함합니다포함합니다포함포함포함포함합니다포함합니다합니다포함포함벡터热
는각시멘트표본에대해180일이지난후의후의경화열을을합니다합니다합니다。
데이터에로버스트선형회귀모델을피팅합니다。
MDL = fitlm(成分,热,“RobustOpts”,“上”)
mdl =线性回归模型(稳健拟合):y ~ 1 + x1 + x2 + x3 + x4Estimate SE tStat pValue ________ _______ ________ ________ (Intercept) 60.09 75.818 0.79256 0.4509 x1 1.5753 0.80585 1.9548 0.086346 x2 0.5322 0.78315 0.67957 0.51596 x3 0.13346 0.8166 0.16343 0.87424 x4 -0.12052 0.7672 -0.15709 0.87906观测数:13,误差自由度:8均方根误差:2.65 r平方:0.979,调整后的R-Squared: 0.969 F-statistic vs. constant model: 94.6, p-value = 9.03 -07
자세한내용은로버스트피팅의결과와표준최소제곱피팅의결과를비교하는使用强大的回归减少异常效果항목을참조하십시오。
시멘트조성물이해당시멘트의경화열에미치는영향을측정하는哈尔德
데이터세트세트를불러。
加载哈尔德
이데이터세트는변수配料
와热
를포함합니다。행렬配料
는는에존재하는가지화학성분의조성비율을포함합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다포함포함포함합니다포함포함합니다포함합니다포함포함포함포함합니다포함합니다합니다포함포함벡터热
는각시멘트표본에대해180일이지난후의후의경화열을을합니다합니다합니다。
데이터에단계적선형회귀모델을피팅합니다。모델에항을추가하는기준에해당하는분계점으로0.06을지정합니다。
mdl =步骤(成分,热,'penter',0.06)
1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-063 .添加x2, FStat = 5.0259, pValue = 0.051687移除x4, FStat = 1.8633, pValue = 0.2054
MDL =线性回归模型:Y〜1 + X1 + X2估计系数:估计系数PVALUE ________ ______________________(拦截)52.577 2.2862 22.998 5.4566E-10 x1 1.4683 0.1213 12.105 2.69225 0.045855 14.442 0.045855 14.442 5.029E-08观察次数:13,自由度误差:10根均匀误差:2.41 R线:0.979,调整R线:0.974 F统计与常数型号:230,P值= 4.41e-09
기본적으로,시작모델은상수모델입니다。stepwiselm
은순방향선택을사용하며,대응되는p- 값이p
0.06값보다작기때문에X4
,X1
,X2
항을이순서대로추가합니다。stepwiselm
은은그런다음역역방향제거제거를용,X2
가모델에포함되면X4
의p- 값이PRemove
의디폴트값인0.1보다커지기때문에모델에서X4
를제거합니다。
항행렬T
는모델의항을지정하는t×(p + 1)행렬입니다。여기서t는개수이고,p는예측변수개수이며,+1은응답변수에합니다。T(i,j)
의값은항我
에포함된변수j
의의입니다。
예를들어,3개의예측변수X1
,X2
,X3
과응답변수y
를X1
,X2
,X3
,y
의순서로포함하는입력값이있다고가정하겠습니다。T
의의각행은하나하나의항을을
[0 0 0 0]
- - - - - -상수항또는절편
[0 1 0 0]
- - - - - -X2
또는x1 ^ 0 * x2 ^ 1 * x3 ^ 0
[1 0 1 0]
- - - - - -x1 * x3
[2 0 0]
- - - - - -x1 ^ 2
[0 1 2 0]
- - - - - -X2 *(×3 ^ 2)
각항의끝에있는0
은응답변수를나타냅니다。일반적으로항행렬에서0으로구성된열벡터는변수의위치를나타냅니다。0
을포함시켜야합니다。
고차원고차원이터세트세트에에대한계산시간을단축Fitrinear.
함수를사용하여선형회귀모델을피팅하십시오。
회귀를정규화하려면Fitrinear.
,套索
,脊
또는plsregress
를사용하십시오。
Fitrinear.
는고차원데이터세트세트에대한회귀회귀회귀를또는또는능형회귀사용하여정규화합니다
套索
는套索또는신축망을사용하여선형회귀에서중복된예측변수를제거합니다。
脊
는상관관계를갖는항이있는회귀를능형회귀를사용하여정규화합니다。
plsregress
는상관관계를갖는항이있는회귀를부분최소제곱을사용하여정규화합니다。
用户使用사용법:
Fitlm.
또는stepwiselm
을사용하여모델을을할때형벡터,문자형문자형,分类형배열,string형형배열또는문자형벡터로구성된배열을포함하는하는하는에는훈련을수터터제공수수수수제공수수또한,'pationalvars'
이름 - 값쌍의인수사용할수없습니다。코드코드생성시범주형범주형예측는지원되지되지모델에범주형예측변수를포함시키려면모델을피팅하기전에dummyvar
을사용하여범주형예측변수를전처리하십시오。
자세한내용은介绍代码生成항목을참조하십시오。
用户使用사용법:
다음객체함수는GPU배열을완전히지원합니다。
다음객체함수는gpu배열입력인수로피팅모델객체를지원합니다。
자세한내용은GPU에서matlab함수함수실행(并行计算工具箱)항목을참조하십시오。
다음MATLAB명령에해당하는링크를클릭했습니다。
명령을실행하려면MATLAB명령창에입력하십시오。웹브라우저는MATLAB명령을지원하지않습니다。
你也可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。