主要内容

이번역번역이지는최신내용을담고담고않습니다않습니다。최신최신내용을영문영문으로여기를클릭클릭

线性模型

선형회귀모델

설명

线性模型은피팅된선형회귀모델객체입니다。회귀모델은응답변수와예측변수사이의관계를설명합니다。선형회귀모델의선형성은예측변수계수의선형성을가리킵니다。

线性模型객체의속성을사용하여피팅된선형회귀모델을사하십시오。객체속성에는계수추정값,요약요약,피팅방법및입력이터에대한정보가포함됩니다。객체함수를사용하여응답변수를하고선형회귀모델수정,평가및및화하십시오。

생성

线性模型객체는Fitlm.또는stepwiselm을사용하여생성할수있습니다。

Fitlm.은고정된모델사양을사용하여선형회귀모델을데이터에피팅합니다。모델에서항을추가하거나제거하려면addTermsremoveterms.또는을사용하십시오。또는단계적선형회귀를사용하여모델을피팅하려면stepwiselm을사용하십시오。

속성

모두확장

계수추정값

이속성은읽기전용입니다。

계수추정값으로구성된공분산행렬로,숫자형값으로구성된p×행렬로지정됩니다。p는피팅된모델에포함된계수의개수입니다。

자세한내용은系数标准错误和置信区间항목을참조하십시오。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

계수이름으로,각각대응되는항의이름을을포함하는문자형벡터로구성셀형배열로로지정지정된셀형배열로지정지정

데이터형:细胞

이속성은읽기전용입니다。

계수값으로,테이블로지정됩니다。系数는각계수계수에대해대해의행과다음과같은같은열을포함

  • 估计- 추정된계수값

  • SE.- 추정값의표준오차

  • Tstat.0 -계수가인지를확인하는검정에대한t -통계량

  • p值——t -통계량에대한p -값

계수계수에대해다른다른검정수행수행Anova.(선형회귀모델만해당)또는colealt를사용하십시오。계수계수추정값의의신뢰구간을coefCI를사용하십시오。

이러한열열중하나하나를벡터로점표기법사용하여속성의요소요소를참조하여속성의의요소참조참조예를들어,다음과같이모델MDL.에서추정된계수벡터를얻습니다。

beta = mdl.cofficients.Estimate

데이터형:桌子

이속성은읽기전용입니다。

모델계수의개수로,양의정수로지정됩니다。NumCoefficients는모델이랭크부족인경우0으로설정되는계수를포함합니다。

데이터형:双倍的

이속성은읽기전용입니다。

모델에서추정된계수의개수로,양의정수로지정됩니다。NumEstimatedCoefficients는모델항이랭크부족인경우0으로설정되는계수를포함하지하지하지하지。NumEstimatedCoefficients는회귀에대한자유도입니다。

데이터형:双倍的

요약통계량

이속성은읽기전용입니다。

오차(잔차)에대한자유도로,관측관측값개수에서추정된계수를뺀값과같으며같으며개수뺀값과같으며같으며개수의정수로지정같으며

데이터형:双倍的

이속성은읽기전용입니다。

관측값진단으로,각관측값에대해하나행과다음표에된열포함하는테테이블로테테블로지정

의미 설명
利用 Hatmatrix.의대각선요소 각관측값에대한利用는관측된예측변수값에의해피팅이결정되는정도를나타냅니다。값이1에가까우면피팅이다른관측관측값의영향을거의않고않고해당해당관측값의해결정됨을을값의해결정됨을값이0에가까우면피팅이주로다른관측값에의해결정됨을나타냅니다。P개의계수와N개의관측값이있는모델모델의,利用의평균값은P / N입니다。2 * P / N보다큰利用값은높은지렛대값나타냅니다나타냅니다。
煮熟 쿡의거리 煮熟는피팅된된값의의된변화량에대한대한측정값값煮熟가평균쿡의거리(库克的距离)의세배보다큰관측값은이상값일수있습니다。
Dffits 피팅된값의Delete-1스케일링된차분 Dffits。절댓값이2 * sqrt(p / n)보다큰값은영향점으로간주될수있습니다。
S2_i 删除-1분산 S2_i는각관측값을차례로삭제하여구한잔차분산추정값집합입니다。이러한추정값을MSE속성에저장된평균제곱(MSE)값과비교할수。
科罗拉蒂奥 공분산행렬식의删除-1비율 科罗拉蒂奥는전체모델에대한공분산행렬의행렬식에대해각관측값을차례로삭제한계수공분산행렬의행렬식비율입니다。1 + 3 * P / N보다크거나1 - 3 * p / n보다작은값은영향점나타냅니다나타냅니다。
dfbetas. 계수추정값의Delete-1스케일링된차분 dfbetas.는는계수추정값값의스케일링된변화량으로구성N×P행렬로,각관측값을차례로제외시켜얻을수있습니다。절댓값이3 / sqrt(n)보다보다값은관측이해당계수에미치는영향이크다는크다는을나타냅니다。
Hatmatrix. 관측된응답변수에서를계산하기위한투영행렬 Hatmatrix.it pited = hatmatrix * y를충족하는N×N행렬이며,여기여기Y는응답변수벡터이고安装는피팅된응답변수값으로구성된벡터입니다。

诊断는이상값및영향관측값구하는데도움이되는정보를포함합니다。删除-1진단은피팅에서각값을차례제외제외얻은을을캡처합니다。자세한내용은帽子矩阵和杠杆库克的距离删除-1统计信息항목을참조하십시오。

관측값진단을플로팅하려면plotdiagnostics.를사용하십시오。

결측값(观察invofo.missing.에있음)또는제외된값(ObservationInfo.Excluded에있음)으로인해피팅에사용되지않은행에는煮熟DffitsS2_i科罗拉蒂奥열에값이포함포함利用dfbetas.Hatmatrix.열에0이포함포함。

이러한열중하나를배열로얻으려면점표기법을사용하여속성의요소를참조하십시오。예를들어,다음과같이모델MDL.에서Delete-1분산벡터를구합니다。

s2i = mdl.diagnostics.s2_i;

데이터형:桌子

이속성은읽기전용입니다。

입력데이터를기준으로피팅된(예측된)응답변수값으로,N×1숫자형벡터로지정됩니다。ñ은입력데이터에포함된관측값개수입니다。预测를사용하여하여다른다른예측변수값에대한예측값을계산安装에대한신뢰한계를계산할수있습니다。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

응답변수값의로그가능도로,각응답변수값이정규분포를따른다는가정에기반하여숫자형값으로지정됩니다。정규분포의평균은피팅된(예측된)응답변수값이고,분산은MSE입니다。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

모델비교기준으로,다음필드를가진구조체로지정됩니다。

  • AIC.-아카이케정보기준(AIC: Akaike信息准则)으로AIC = -2 * logL + 2 *米입니다。여기서logl.은로그가능도이며은추정된모수의개수입니다。

  • AICC.- 표본표본크기에대해수정수정된아카케기준기준AICC = AIC +(2 * M *(M + 1))/(N - M - 1)입니다。여기서n은관측값개수입니다。

  • BIC- 베이즈정보기준(BIC:Bayesian Information Criterion)으로BIC = -2 * logl + m * log(n)입니다。

  • 中安集团经贸- 일관된아카이케정보기준으로caic = -2 * logl + m *(log(n)+ 1)입니다。

정보기준은동일한데이터에에대한여러모델피팅을하는사용할할있는모델선택선택도구할있는모델선택도구도구이기준은복잡도(특히특히개수)에대한벌점을포함하는모델에가능도측정측정값입니다입니다。각기각기다른정보기준기준은형식으로구분구분

여러모델을비교할때는정보기준값이가장낮은모델이가장적합한피팅모델입니다。최적의피팅모델은모델비교에사용된기준에따라다를수있습니다。

기준값중하나를스칼라로구하려면점표기법을사용하여속성을참조하십시오。예를들어,다음과같이모델MDL.에서aiC값另类投资会议를구합니다。

AIC = mdl.modelcrertion.aic.

데이터형:结构体

이속성은읽기전용입니다。

평균제곱오차(잔차)로,숫자형값으로지정。

MSE = SSE / DFE,

여기서mse는는제곱오차이고,sse는제곱오차의이며,dfe는자유도입니다。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

피팅된모델의잔차로,각관측값에대해하나의행과다음표에설명된열을포함하는테이블로지정됩니다。

설명
관측값에서피팅값을뺀값입니다。
皮尔逊 원시원시잔차를평균제곱오차의(RMSE)으로으로값입니다。
标准化 원시잔차를를잔차의의된표준편차로로나눈값값
Studentized 원시잔차를잔차표준편차에대한독립적인추정값으로나눈값입니다。관측값我에대한잔차를관측값我를제외한모든관측값을기반으로하는오차표준편차의추정값으로나누어얻습니다。

잔차에대한플롯을생성하려면plotResiduals를사용하십시오。자세한내용은残差항목을참조하십시오。

결측값(观察invofo.missing.에있음)또는제외된값(ObservationInfo.Excluded에있음)으로인해피팅에사용되지않은행에는값이포함포함。

이러한열열중하나하나를벡터로점표기법사용하여속성의요소요소를참조하여속성의의요소참조참조예를들어,다음과같이모델MDL.에서원시잔차벡터r을구합니다。

R = mdl.Residuals.Raw

데이터형:桌子

이속성은읽기전용입니다。

평균제곱오차(잔차)의제곱근으로,숫자형값으로지정됩니다。

RMSE = SQRT(MSE),

여기서RMSE는평균제곱오차의제곱근이고MSE는평균제곱오차입니다。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

모델모델대한결정계수값,다음두필드를가지는구조체로구조체로지정。

  • 普通的- 일반(수정되지않은)결정계수

  • 调整- 계수개수에대해수정된결정계수

결정계수값은모델로설명되는총제곱합의비율입니다。일반결정계수값은SSR속성및SST속성과관련이있습니다。

Rsquared = SSR /风场

여기서SST는총제곱합이고,SSR은제곱의회귀합입니다。

자세한내용은결정계수(R제곱)항목을참조하십시오。

이러한값중하나를스칼라로얻으려면점표기법을사용하여속성을참조하십시오。예를들어,다음과같이모델MDL.에서수정된결정계수값을구합니다。

r2 = mdl.rsquared.Adjusted.

데이터형:结构体

이속성은읽기전용입니다。

제곱오차(잔차)의합으로,숫자형값으로지정됩니다。

피타고라스정리는다음을합니다합니다。

SST = SSE + SSR

여기서SST는총제곱합이고,上交所는제곱오차의합이고,SSR은제곱의회귀합입니다。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

회귀제곱합으로,숫자형값으로지정됩니다。제곱의회귀합은평균과피팅된값간의편차에대한제곱합과같습니다。

피타고라스정리는다음을합니다합니다。

SST = SSE + SSR

여기서SST는총제곱합이고,上交所는제곱오차의합이고,SSR은제곱의회귀합입니다。

데이터형:单身的|双倍的

이속성은읽기전용입니다。

총제곱합으로,숫자형값으로지정됩니다。총제곱합은意思是(y)와응답변수벡터y간의편차에대한같습니다같습니다。

피타고라스정리는다음을합니다합니다。

SST = SSE + SSR

여기서SST는총제곱합이고,上交所는제곱오차의합이고,SSR은제곱의회귀합입니다。

데이터형:单身的|双倍的

피팅방법

이속성은읽기전용입니다。

로버스트피팅정보로,다음표에설명된필드를가지는구조체로지정됩니다。

필드 설명
WgtFun 로버스트가중치함수。'bisquare'를예로들수있습니다(“RobustOpts”참조)。
조율상수。WgtFun'OLS'이거나WgtFun이디폴트조율가1인사용자지정가중치에에대한핸들인경우이필드는비어비어([])。
权重 로버스트피팅의최종반복사용가중치로구성된벡터。CompactLinearModel.객체의경우이필드는비어있습니다。

로버스트회귀를사용하여모델을생성하지않으면이구조체는비어있습니다。

데이터형:结构体

이속성은읽기전용입니다。

단계적피팅정보로,다음표에설명된필드를갖는구조체로지정됩니다。

필드 설명
开始 시작모델을나타내는식
降低 하한모델을나타내는식。降低의의항들은모델모델에서유지되어야되어야
상한모델을나타내는식。모델은보다더많은항을포함할수없습니다。
标准 단계별알고리즘에사용되는기준(예:“上世纪”
p 标准이항을추가할분계점
PRemove 标准이항을제거할분계점
历史 피팅에서수행하는단계를나타내는테이블

历史테이블은초기피팅을포함하여각단계에대해하나의행과다음표에설명된열을포함합니다。

설명
行动

해당단계에서수행되는동작:

  • “开始”——첫번째단계

  • '添加'- 항이추가됨

  • '消除'——항이제거됨

术语
  • 行动“开始”이면术语은시작모델사양을지정합니다。

  • 行动'添加'또는'消除'이면术语은해당단계에서추가되거나제거되는항을지정합니다。

术语 항행렬의모델照片
DF 해당단계이후의회귀자유도
delDF 이전단계에비해달라진회귀자유도의변화량(항을제거하는단계의경우음수임)
异常 해당단계에서의이탈도,즉즉잔차(일반화일반화회귀모델해당해당)
FSTAT 해당단계로이어지는F- 통계량
pvalue. F——통계량의p——값

단계적회귀를사용하여모델을피팅하지않는한,구조체는비어있습니다。

데이터형:结构体

입력데이터

이속성은읽기전용입니다。

모델정보로,LinearFormula객체로지정됩니다。

다음과같이점표기법을사용하여피팅된모델MDL.의수식을표시합니다。

mdl.formula.

이속성은읽기전용입니다。

피팅피팅가피팅피팅사용하는하는관측값,양의정수로지정。NumObservations는원래테이블,데이터셋또는행렬에제공된관측값개수에서제외된행('排除'이름 - 값쌍의인수로설정됨됨됨에이있는행을뺀값입니다。

데이터형:双倍的

이속성은읽기전용입니다。

모델을피팅하는데사용되는예측변수의개수로,양의정수로지정됩니다。

데이터형:双倍的

이속성은읽기전용입니다。

입력입력이터에에포함되는되는의의의의의의의개수로의의의정수로정수로지정의의의정수로정수로지정numvarialbles.는원래이블또는또는이터셋데포함된변수개수이거나예측예측예측행렬및변수벡터에포함된열개수개수입니다개수개수개수입니다개수개수입니다개수개수개수입니다개수개수개수개수개수개수개수개수개수개수개수개수개수개수개수개수총개수개수개수개수

numvarialbles.는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。

데이터형:双倍的

이속성은읽기전용입니다。

관측값정보로,n×4테이블로지정지정。여기서n은입력입력이터의의행개수와와。ObservationInfo는다음표에설명된열을포함합니다。

설명
权重 관측값가중치로,숫자형값으로지정됩니다。디폴트값은1입니다。
排除 제외된관측값에대한표시자로,논리값으로지정됩니다。'排除'이름——값쌍의인수를사용하여피팅에서관측값을제외한경우값은真的입니다。
失踪 결측관측값에대한,논리값으로지정。관측값이결측된경우값은真的입니다。
子集 피팅함수가관측값을사용하는지여부를나타내는표시자로,논리값으로지정됩니다。관측값이제외되지않거나결측되지않은경우,즉피팅함수가해당관측값을사용하는경우값은真的입니다。

이러한열열중하나하나를벡터로점표기법사용하여속성의요소요소를참조하여속성의의요소참조참조예를들어,다음과같이모델MDL.의가중벡터w를구합니다。

w = mdl.observationInfo.weight.

데이터형:桌子

이속성은읽기전용입니다。

관측값이름으로,피팅에사용되는값의이름을을포함하는문자형벡터로된셀형배열배열지정지정지정구성된셀형셀형배열지정지정

  • 피팅이관측값이름을포함하는이블또는데이터셋을을기반으로으로하는观察名称는이름을사용용。

  • 그렇지않은경우观察名称는빈셀형배열입니다。

데이터형:细胞

이속성은읽기전용입니다。

모델을피팅하는데사용되는예측변수의이름으로,문자형벡터로구성된셀형배열로지정됩니다。

데이터형:细胞

이속성은읽기전용입니다。

응답변수이름으로,문자형벡터로지정됩니다。

데이터형:char

이속성은읽기전용입니다。

变量에에변수에변수로정보다음표에설명된열을갖는표에설명된정보갖는표에설명된정보정보포함포함된설명대한정보정보정보정보포함정보

설명
班级 변수클래스로,문자형벡터로구성된셀형배열로지정됩니다(예:'双倍的'“绝对”)。
范围

변수변수범위,벡터로구성된셀형배열로지정됩니다。

  • 연속형변수 - 최솟값과최댓값으로구성된,요소를2개가진벡터最大限度

  • 범주형변수 - 고유한변수값구성된벡터

InModel 피팅된모델에어느변수가포함되었는지에대한표시자로,논리형벡터로지정됩니다。모델이변수를포함하는경우값은真的입니다。
是基本的 범주형변수에대한표시자로,논리형벡터로지정됩니다。변수가범주형인경우값은真的입니다。

VariableInfo는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。

데이터형:桌子

이속성은읽기전용입니다。

변수의이름으로,문자형벡터로구성된셀형배열로지정됩니다。

  • 피팅이테테또는이터셋을기반으로경우이속성은해당해당이블에이터셋데의의이름을을제공제공제공제공제공제공

  • 피팅이예측변수행렬과응답변수벡터를기반으로하는경우variablenames.는피팅방법의'varnames'이름——값쌍의인수로지정된값을포함합니다。'varnames'의디폴트값은{'x1','x2',...,'xn','y'}입니다。

variablenames.는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。

데이터형:细胞

이속성은읽기전용입니다。

입력데이터로,테이블로지정됩니다。变量는예측변수값과응답변수값을모두포함합니다。피팅이테이블또는数据集형배열을기반으로하는경우变量는해당이블또는dataset형배열의모든이터를를포함。그렇지않은경우变量는입력데이터행렬X와응답변수벡터y에서생성되는테이블입니다。

变量는예측변수또는응답변수로모델을피팅하는데사용되지않은변수도포함합니다。

데이터형:桌子

객체함수

모두확장

袖珍的 紧凑线性回归模型
addTerms 为线性回归模型添加术语
removeterms. 从线性回归模型中移除术语
通过添加或移除术语来改进线性回归模型
Feval. 预测线性回归模型的反应使用一个输入为每个预测器
预测 预测线性回归模型的响应
随机的 用随机噪声模拟线性回归模型的响应
Anova. 方差分析线性回归模型
coefCI 线性回归模型系数估计的置信区间
colealt 线性回归模型系数线性假设检验
DWTest. 线性回归模型对象的德宾-沃森检验
partialDependence 计算部分依赖
阴谋 散点图或添加的线性回归模型的可变曲线
plotAdded 添加了线性回归模型的可变曲线
plotAdjustedResponse 线性回归模型调整后的响应图
plotdiagnostics. 绘制线性回归模型的观察诊断图
plotEffects 绘制预测因子在线回归模型的主要效果
plotInteraction 在线性回归模型中绘制两个预测因子的交互作用
plotPartialDependence 创建部分依赖图(PDP)和个人有条件期望(ICE)情节
plotResiduals 线性回归模型的绘图残差
plotslice. 通过回归系数的表面切片的情节
收集 从GPU中收集机器学习模型的属性

예제

모두축소

행렬입력이터세트를사용하여선형회귀모델을피팅합니다。

행렬입력데이터세트인carsmall데이터세트세트를불러。

加载carsmallX =(重量、马力、加速度);

Fitlm.을사용하여선형회귀모델을피팅합니다。

mdl = fitlm (X,英里/加仑)
mdl = Linear regression model: y ~ 1 + x1 + x2 + x3 Estimated Coefficients: Estimate SE tStat pValue __________ _________ _________ __________ (Intercept) 47.977 3.8785 12.37 4.8957e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742e-08 x2 -0.042943 0.024313 -1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236观测数:93、误差自由度:89均方根误差:4.09 r平方:0.752,校正r平方:0.744 f统计量与常数模型:90,p-value = 7.38e-27

모델표시화면에모델식,추정된계수및모델요약이포함됩니다。

표시된모델식Y〜1 + x1 + x2 + x3 y β 0 + β 1 X 1 + β 2 X 2 + β 3. X 3. + ε. 에에합니다。

모델표시화면에系数속성에저장된,추정된계수정보도표시됩니다。系数속성을표시합니다。

mdl。系数
ANS =4×4表估计SE TSTAT p值__________ _________ _________ __________(截距)47.977 3.8785 12.37 4.8957e-21 X1 -0.0065416 0.0011274 -5.8023 9.8742e-08×2 -0.042943 0.024313 -1.7663 0.08078×3 -0.011583 0.19333 -0.059913 0.95236

系数속성속성은다음과같은같은열을포함포함

  • 估计- 모델모델에서각각의의대응항에대한계수추정값값예예를,상수항(截距)에대한추정값은47.977입니다。

  • SE.- 계수의표준오차입니다。

  • Tstat.- 모델모델에주어진다른다른예측변수를상정한,'대응하는계수가0이아니다'는대립가설에대해대해대해대해대해0다다다다다설설설을검정하는하는용된각계수에에t——통계량입니다。참고로,tStat =估计/ SE입니다。예를들어,절편에대한t——통계량은47.977/3.8785 = 12.37입니다。

  • p值0 -대응하는계수가인지아니면0이아닌지를검정하는가설에대한t——통계량의p- 값입니다。예를들어,X2에대한t——통계량의p0.05 -값은보다크므로모델의다른항을고려할때이항은5%유의수준에서유의미하지않습니다。

모델의요약통계량은다음과같습니다。

  • 观察数- - - - - -값값을포함하지하지않는행개수개수예를들어,XMPG의행개수는100개인데MPG데이터벡터에값이6개있고马力데이터벡터벡터에다른관측값에1개값이있기때문에观察数93年는입니다。

  • 错误自由度- - - - - -n- - - - - -p이며,여기서n은관측값의개수이고p는절편을포함하여모델에포함된계수의개수입니다。예를들어,이모델은4개의예측변수를가지므로错误自由度은93 - 4 = 89‰。

  • 根均匀误差- 평균제곱오차의제곱근으로,오차분포의표준편차를추정합니다。

  • r-平方调整后的R平方- 각각결정계수와수정된계수계수를나타냅니다。예를들어,r-平方값은모델이응답응답MPG의변동성의약75%를설명한다는것을나타냅니다。

  • F统计与常量模型- 회귀모델에대한F- 의검정으로,이모델이상수항만만으로구성된모델보다훨씬더잘피팅여부를검정검정되는지여부를검정

  • 假定值- 모델에대한F——검정의p- 값입니다。예를들어,이모델모델p- 값이7.3816e-27인경우유의미합니다。

모델속성(NumObservations教育部RMSERsquared)에서,그리고Anova.함수를사용하여이러한통계량을확인할수있습니다。

ANOVA(MDL,'概括'
ANS =3×5表SUMSQ DF MeanSq˚Fp值______ __ ______ __________总计6004.8 92 65.269型号4516 3 1505.3 89.987 7.3816e-27残1488.8 89 16.728

범주형예측변수를포함하는선형회귀모델을피팅합니다。모델에서기준기준레벨을제어하기위해범주형예측변수의를다시정렬정렬정렬를다시정렬정렬그런다음Anova.를사용하여범주형변수의유의성을검정합니다。

범주형예측변수를갖는모델

carsmall데이터세트를불러오고,MPG의선형회귀모델을model_year.의함수로생성합니다。숫자형벡터model_year.를범주형변수로처리하기위해'pationalvars'이름 - 값쌍의인수를사용하여예측변수를식별합니다。

加载carsmallmdl = fitlm(model_year,mpg,'pationalvars'1,'varnames',{'Model_Year'“英里”})
mdl =线性回归模型:MPG ~ 1 + Model_Year Estimated Coefficients: Estimate SE tStat pValue ________ ______ ______ __________ (Intercept) 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 3.8839 1.4059 2.7625 0.0069402 Model_Year_82 14.02 1.4369 9.7571 8.2164e-16观测数:94,误差自由度:91均方根误差:5.56 R-squared: 0.531, Adjusted R-squared: 0.521 F-statistic vs. constant model: 51.6, p-value = 1.07e-15

표시된모델식MPG〜1 + model_year는다음에해당합니다。

MPG β 0 + β 1 Ι 76. + β 2 Ι 82. + ε.

여기서 Ι 76. Ι 82. model_year.의값이각각76및82일때값1인이표시변수입니다。model_year.변수는3개의고유한을포함하고있으며,이는独特함수를사용해서확인할수있습니다。

唯一的(Model_Year)
ans =3×170 76 82.

Fitlm.model_year.에서가장작은값을기준레벨('70')로로선택하고두개의표시표시 Ι 76. Ι 82. 를를합니다。모델이3개의표시변수(각레벨당1개)와1개​​의절편항을포함하는설계에이랭크부족이되므로부족부족이은은은

전체표시변수를갖는모델

MDL.항의을절편항이없고3개의표시변수를모델로해석할수있습니다。

y β 0 Ι x 1 70 + β 0 + β 1 Ι x 1 76. + β 0 + β 2 Ι x 2 82. + ε.

또는표시변수를수동으로생성하고모델식을지정하여절편항이없고3개의표시변수를갖는모델을생성할수도있습니다。

temp_year = dummyvar(分类(model_year));model_year_70 = temp_year(:,1);model_year_76 = temp_year(:,2);model_year_82 = temp_year(:,3);TBL =表(Model_year_70,model_year_76,model_year_82,mpg);mdl = fitlm(tbl,'mpg〜model_year_70 + model_year_76 + model_year_82  -  1'
MDL =线性回归模型:MPG〜Model_Year_70 + Model_Year_76 + Model_Year_82估计系数:估计SE TSTAT p值________ _______ ______ __________ Model_Year_70 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 21.574 0.95387 22.617 4.0156e-39 Model_Year_82 31.71 0.99896 31.743 5.2234e-51的数观察:94,误差自由度:91根均方误差:5.56

모델에서기준레벨선택하기

먼저범주형변수를만듭니다。

年=分类(model_year);

类别함수를사용하여범주의순서를확인합니다。

类别(年)
ans =3x1细胞{'70'} {'76'} {'82'}

를예측변수로사용할경우Fitlm.은첫번째범주'70'을기준레벨로선택합니다。reordercats함수를사용하여를다시정렬합니다。

Year_reordered = reordercats(一年,{“76”'70''82'});类别(年份)
ans =3x1细胞{'76'} {'70'} {'82'}

Year_reordered의첫번째범주는“76”입니다。MPG의선형회귀모델을Year_reordered의함수로생성합니다。

mdl2 = fitlm (Year_reordered MPG,'varnames',{'Model_Year'“英里”})
MDL2 =线性回归模型:MPG〜1 + Model_year估计系数:估计SE TSTAT PVALUE ________ _______ ______________________________70 -3.8839 1.4059 -2.7620 0.136 1.3812 7.3385 8.7634E-11观察数目:94,误差自由度:91根均匀误差:5.56 R线:0.531,调整R线:0.521 F统计与常数型号:51.6,p值= 1.07e-15

mdl2“76”을기준레벨로사용하고두개의표시변수 Ι 70 Ι 82. 를포함합니다。

범주형예측변수평가하기

mdl2의모델표시화면은대응되는계수가0인지여부를검정하기위해각항의p——값을포함합니다。각p- 값은각표시표시를를사합니다。범주형변수model_year.를표시변수의그룹으로조사하려면Anova.를사용하십시오。모델모델의상수항을을제외각변수에대해분산분석통계량을포함하는성분성분분산반환반환“组件”(디폴트값)옵션을사용합니다。

ANOVA(MDL2,“组件”
ANS =2×5表SUMSQ DF MeanSq˚Fp值______ __ ______ _____ __________ Model_Year 3190.1 2 1595.1 51.56 1.0694e-15错误2815.2 91 30.936

성분분산분석표는표시변수의p- 값보다작은model_year.변수의p——값을포함합니다。

시멘트조성물이해당시멘트의경화열에미치는영향을측정하는哈尔德데이터세트세트를불러。

加载哈尔德

이데이터세트는변수配料를포함합니다。행렬配料는는에존재하는가지화학성분의조성비율을포함합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다포함포함포함합니다포함포함합니다포함합니다포함포함포함포함합니다포함합니다합니다포함포함벡터는각시멘트표본에대해180일이지난후의후의경화열을을합니다합니다합니다。

데이터에로버스트선형회귀모델을피팅합니다。

MDL = fitlm(成分,热,“RobustOpts”“上”
mdl =线性回归模型(稳健拟合):y ~ 1 + x1 + x2 + x3 + x4Estimate SE tStat pValue ________ _______ ________ ________ (Intercept) 60.09 75.818 0.79256 0.4509 x1 1.5753 0.80585 1.9548 0.086346 x2 0.5322 0.78315 0.67957 0.51596 x3 0.13346 0.8166 0.16343 0.87424 x4 -0.12052 0.7672 -0.15709 0.87906观测数:13,误差自由度:8均方根误差:2.65 r平方:0.979,调整后的R-Squared: 0.969 F-statistic vs. constant model: 94.6, p-value = 9.03 -07

자세한내용은로버스트피팅의결과와표준최소제곱피팅의결과를비교하는使用强大的回归减少异常效果항목을참조하십시오。

시멘트조성물이해당시멘트의경화열에미치는영향을측정하는哈尔德데이터세트세트를불러。

加载哈尔德

이데이터세트는변수配料를포함합니다。행렬配料는는에존재하는가지화학성분의조성비율을포함합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다합니다포함포함포함합니다포함포함합니다포함합니다포함포함포함포함합니다포함합니다합니다포함포함벡터는각시멘트표본에대해180일이지난후의후의경화열을을합니다합니다합니다。

데이터에단계적선형회귀모델을피팅합니다。모델에항을추가하는기준에해당하는분계점으로0.06을지정합니다。

mdl =步骤(成分,热,'penter',0.06)
1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-063 .添加x2, FStat = 5.0259, pValue = 0.051687移除x4, FStat = 1.8633, pValue = 0.2054
MDL =线性回归模型:Y〜1 + X1 + X2估计系数:估计系数PVALUE ________ ______________________(拦截)52.577 2.2862 22.998 5.4566E-10 x1 1.4683 0.1213 12.105 2.69225 0.045855 14.442 0.045855 14.442 5.029E-08观察次数:13,自由度误差:10根均匀误差:2.41 R线:0.979,调整R线:0.974 F统计与常数型号:230,P值= 4.41e-09

기본적으로,시작모델은상수모델입니다。stepwiselm은순방향선택을사용하며,대응되는p- 값이p0.06값보다작기때문에X4X1X2항을이순서대로추가합니다。stepwiselm은은그런다음역역방향제거제거를용,X2가모델에포함되면X4p- 값이PRemove의디폴트값인0.1보다커지기때문에모델에서X4를제거합니다。

세부정보

모두확장

대체기능

  • 고차원고차원이터세트세트에에대한계산시간을단축Fitrinear.함수를사용하여선형회귀모델을피팅하십시오。

  • 회귀를정규화하려면Fitrinear.套索또는plsregress를사용하십시오。

    • Fitrinear.는고차원데이터세트세트에대한회귀회귀회귀를또는또는능형회귀사용하여정규화합니다

    • 套索는套索또는신축망을사용하여선형회귀에서중복된예측변수를제거합니다。

    • 는상관관계를갖는항이있는회귀를능형회귀를사용하여정규화합니다。

    • plsregress는상관관계를갖는항이있는회귀를부분최소제곱을사용하여정규화합니다。

확장기능

R2012A에개발됨