LinearModel

线性回归模型

全部展开页面

描述

LinearModel是一个拟合的线性回归模型对象。回归模型描述了响应和预测因子之间的关系。线性回归模型中的线性度是指预测器系数的线性度。

使用a的属性LinearModel摘要目的探讨拟合的线性回归模型。对象属性包括关于系数估计、汇总统计、拟合方法和输入数据的信息。使用对象函数来预测响应，并修改、评估和可视化线性回归模型。

创建

创建一个LinearModel对象的使用fitlm或stepwiselm．

fitlm使用固定的模型规范对数据拟合线性回归模型。使用addterms.那removeterms.，或者步从模型中添加或删除术语。另外,使用stepwiselm用逐步线性回归拟合模型。

特性

展开全部

系数估计

`CoefficientCovariance`-系数估计的协方差矩阵
数字矩阵

此属性是只读的。

系数估计的协方差矩阵，指定为P.——- - - - - -P.数值矩阵。P.为拟合模型中系数的个数。

有关详细信息,请参见标准误差和置信区间．

数据类型:单身的|双

`CoefficientNames`-系数的名字
字符向量的单元格数组

此属性是只读的。

系数名称，指定为字符向量的单元数组，每个单元包含相应项的名称。

数据类型:细胞

`系数`-系数值
表格

此属性是只读的。

系数值，指定为表。系数包含每行系数和这些列:

估计- 估计系数值
SE-估计的标准误差
Tstat.-T.用于测试系数为零的测试
pValue-P.- 为valueT.-统计

使用方差分析(仅适用于线性回归模型)或COLEYEST.对系数进行其他测试。使用COEFCI.找出系数估计的置信区间。

要获取这些列中的任何一列作为向量，请使用点表示法在属性中建立索引。例如，得到模型中估计的系数向量mdl：

β= mdl.Coefficients.Estimate

数据类型:表格

`numcoffients.`-模型系数数
正整数

此属性是只读的。

模型系数的数目，指定为正整数。numcoffients.包括当模型项缺乏等级时设置为零的系数。

数据类型:双

`NumEstimatedCoefficients`-估计系数数
正整数

此属性是只读的。

模型中的估计系数数，指定为正整数。NumEstimatedCoefficients不包括当模型项缺乏等级时被设为零的系数。NumEstimatedCoefficients是回归的自由度。

数据类型:双

摘要统计信息

`DFE.`-误差的自由度
正整数

此属性是只读的。

错误的自由度（残差），等于观察次数减去估计系数的数量，指定为正整数。

数据类型:双

`诊断`-观察诊断
表格

此属性是只读的。

观察诊断，指定为包含每个观察的一行的表和本表中描述的列。

列	意义	描述
`利用`	对角元素的`Hatmatrix.`	`利用`对于每一个观察表明，在何种程度上的拟合是由观察的预测值决定的。接近于`1`表示该拟合主要由该观察结果确定，几乎没有其他观察结果的贡献。接近于`0.`表明拟合在很大程度上是由其他观察结果决定的。对于具有`P.`系数和`N.`观察，平均值`利用`是`P / N`．一种`利用`值大于`2 * P / N`表明高杠杆。
`CooksDistance`	厨师的距离	`CooksDistance`是对拟合值按比例变化的度量。一个观察`CooksDistance`库克距离可能是一个异常值。
`Dffits`	删除-1比例差异的拟合值	`Dffits`是每个观察的拟合值中的缩放变化，从而排除从拟合的观察结果。值大于`2 * sqrt（p / n）`绝对值可以被认为是有影响力的。
`S2_i`	Delete-1方差	`S2_i`是通过依次删除每次观察来获得的一组残留方差估计。可以将这些估计与存储在中的均方误差（MSE）值进行比较`均方误差`财产。
`CovRatio`	减去-1协方差行列式之比	`CovRatio`为依次删除每个观测值的系数协方差矩阵的行列式与整个模型的协方差矩阵的行列式之比。值大于`1 + 3 * P / N`或小于`1 - 3 * p / n`表明有影响力的点。
`Dfbetas`	在系数估计中删除-1缩放差异	`Dfbetas`是一个`N.`——- - - - - -`P.`由依次排除每个观测结果得出的系数估计中的比例变化矩阵。值大于`3 / sqrt（n）`在绝对值上表示观测值对相应系数有显著影响。
`Hatmatrix.`	要计算的投影矩阵`安装`从观察到的响应	`Hatmatrix.`是一个`N.`——- - - - - -`N.`矩阵,`安装= HatMatrix * Y`,在那里`y`是响应矢量和`安装`为拟合响应值的向量。

诊断包含有助于发现异常值和有影响的观察结果的信息。Delete-1诊断捕获从匹配中依次排除每个观察结果的变化。有关详细信息，请参见帽子矩阵和杠杆那库克的距离,Delete-1统计．

使用plotDiagnostics绘制观察诊断图。

由于缺少值而未在适合中使用的行(在ObservationInfo。失踪)或排除值(在ObservationInfo。被排除在外)包含南价值在CooksDistance那Dffits那S2_i,CovRatio列和零利用那Dfbetas,Hatmatrix.列。

要将任何这些列作为数组，请使用点表示法索引到属性中。例如，在模型中获取删除-1方差向量mdl：

s2i = mdl.diagnostics.s2_i;

数据类型:表格

`安装`-根据输入数据拟合响应值
数值向量

此属性是只读的。

根据输入数据拟合(预测)响应值，指定为N.1数字向量。N.为输入数据中的观测次数。使用预测计算对其他预测值的预测，或计算置信范围安装．

数据类型:单身的|双

`LogLikelihood`-loglikelihie
数值

此属性是只读的。

响应值的对数似然，指定为一个数值，基于每个响应值服从正态分布的假设。正态分布的均值是拟合的(预测的)响应值，方差是均方误差．

数据类型:单身的|双

`ModelCriterion`-模型比较标准
结构

此属性是只读的。

模型比较标准，指定为具有以下字段的结构:

另类投资会议-赤池信息准则。AIC = -2 *logL + 2*m,在那里logLloglikelihood和M.为估计参数的个数。
AICC.-赤池信息标准修正的样本量。AIC = AIC + (2*m*(m+1))/(n-m-1),在那里N.为观察次数。
BIC.-贝叶斯信息准则。BIC = -2 *logL + m*log(n)．
中安集团经贸- 一致的Akaike信息标准。CAIC = -2 *logL + m*(log(n)+1)．

信息标准是您可以使用的模型选择工具来比较多个型号适合同一数据。这些标准是基于可能性的模型拟合措施，包括复杂性的惩罚（具体地，参数的数量）。不同的信息标准通过罚款的形式来区分。

当比较多个模型时，信息准则值最低的模型是拟合最好的模型。最佳拟合模型可以根据模型比较所用的标准而变化。

要获取标量形式的任何标准值，请使用点表示法在属性中建立索引。例如，获取AIC值另类投资会议在模型中mdl：

AIC = mdl.modelcrertion.aic.

数据类型:塑造

`均方误差`-均方误差
数值

此属性是只读的。

均方误差(残差)，指定为数值。

均方误差=上交所/DFE.那

在哪里均方误差为均方误差，上交所是误差平方和，和DFE.是自由度。

数据类型:单身的|双

`剩余物`-拟合模型的残差
表格

此属性是只读的。

拟合模型的残差，指定为一个表，其中包含每个观测的一行和表中描述的列。

列	描述
`生的`	观测减拟合值
`皮尔森`	原始残差除以根均方误差（RMSE）
`标准化`	原始残差除以其估计的标准差
`Studentized`	原始残余除以残留标准偏差的独立估计。观察的残余一世除以基于除观测外的所有观测的误差标准差的估计值一世．

使用plotResiduals绘制残差图。有关详细信息,请参见剩余物．

由于缺少值而未在适合中使用的行(在ObservationInfo。失踪)或排除值(在ObservationInfo。被排除在外)包含南值。

要获取这些列中的任何一列作为向量，请使用点表示法在属性中建立索引。例如，获得原始残留载体R.在模型中mdl：

r = mdl.Residuals.Raw

数据类型:表格

`RMSE`-根均匀误差
数值

此属性是只读的。

均方根误差(残差)，指定为一个数值。

RMSE=√均方误差)，

在哪里RMSE是根均匀的误差和均方误差为均方误差。

数据类型:单身的|双

`Rsquared`-模型的r形值
结构

此属性是只读的。

模型的r平方值，指定为具有两个字段的结构:

普通的-普通(未调整)r平方
调整- r平方调整系数的数量

r平方值是模型所解释的总平方和的比例。一般的r平方值与苏维埃社会主义共和国和风场属性:

RSQUARED = SSR / SST = 1 - SSE / SST那

在哪里风场是总平方和，上交所是误差平方和，和苏维埃社会主义共和国为回归平方和。

有关详细信息,请参见确定系数（R角）．

要将这些值中的任何一个作为标量，请使用点符号索引到属性中。例如，在模型中获得调整后的R线值mdl：

r2 = mdl.Rsquared.Adjusted

数据类型:塑造

`上交所`-误差平方和
数值

此属性是只读的。

误差的平方和(残差)，指定为一个数值。

毕达哥拉斯定理意味着

sst = sse + ssr那

在哪里风场是总平方和，上交所是误差平方和，和苏维埃社会主义共和国为回归平方和。

数据类型:单身的|双

`苏维埃社会主义共和国`-回归平方和
数值

此属性是只读的。

回归平方和，指定为一个数值。回归平方和等于拟合值离均值的方差平方和。

毕达哥拉斯定理意味着

sst = sse + ssr那

在哪里风场是总平方和，上交所是误差平方和，和苏维埃社会主义共和国为回归平方和。

数据类型:单身的|双

`风场`-总平方和
数值

此属性是只读的。

用数值指定的平方和的总和。总平方和等于响应向量的偏差平方和y从意思是（y）．

毕达哥拉斯定理意味着

sst = sse + ssr那

在哪里风场是总平方和，上交所是误差平方和，和苏维埃社会主义共和国为回归平方和。

数据类型:单身的|双

拟合方法

`健壮的`-强大的拟合信息
结构

此属性是只读的。

鲁棒拟合信息，指定为具有本表中描述字段的结构。

场	描述
`WGTFUN.`	鲁棒加权函数，如`“bisquare”`(见`'抢劫'`的）
`调优`	调整常数。这个字段是空的（`［］`）如果`WGTFUN.`是`'OLS'`或者,如果`WGTFUN.`是带有默认调优常数1的自定义权重函数的函数句柄。
`重量`	鲁棒拟合最后迭代所用的权值向量。对象的该字段为空`CompactLinearModel.`对象。

除非您使用强大的回归，否则此结构为空。

数据类型:塑造

`步骤`-分段拟合的信息
结构

此属性是只读的。

逐步拟合信息，指定为具有表中所述字段的结构。

场	描述
`开始`	表示起始模型的公式
`降低`	表示下界模型的公式。的条款`降低`必须保持在模型中。
`上`	表示上限模型的公式。该模型不能包含更多的术语`上`．
`标准`	准则用于逐步算法，如`上交所的`
`被关闭的`	阈值`标准`添加一个术语
`PRemove`	阈值`标准`去掉一个词
`历史`	表中表示在适合的步骤

这历史表为每个步骤包含一行，包括初始匹配和表中描述的列。

列	描述
`行动`	步骤中采取的行动: `'开始'`——第一步 `“添加”`—添加新术语 `“删除”`—删除一个术语
`TermName`	如果`行动`是`'开始'`那`TermName`指定起始模型规范。如果`行动`是`“添加”`或`“删除”`那`TermName`指定在步骤中添加或删除的术语。
`条款`	的模型规范术语矩阵
`DF.`	步后的回归自由度
`达尔德夫`	与上一步相比，回归自由度的变化(对于删除一项的步骤为负)
`异常`	步长偏差(残差平方和)(仅适用于广义线性回归模型)
`函数`	F-导致步骤的统计数据
`pvalue.`	P.价值的F-统计

除非使用逐步回归，否则结构为空。

数据类型:塑造

输入数据

`公式`-模型信息
`LinearFormula`目的

此属性是只读的。

模型信息，指定为LinearFormula对象。

显示拟合型号的公式mdl使用点符号:

mdl。F或M.ula

`numobservations.`-数量的观察
正整数

此属性是只读的。

用于拟合的拟合函数的观测数，指定为正整数。numobservations.原始表、数据集或矩阵中提供的观察数是否减去任何排除的行(用“排除”名称-值对参数)或缺少值的行。

数据类型:双

`numpredictors.`-预测变量数
正整数

此属性是只读的。

用于适合模型的预测变量数量指定为正整数。

数据类型:双

`numvarialbles.`-变量数量
正整数

此属性是只读的。

输入数据中的变量数，指定为正整数。numvarialbles.是原始表或数据集中的变量数，或预测器矩阵和响应矢量中的列总数。

numvarialbles.还包括任何不用于将模型作为预测器或响应拟合模型的变量。

数据类型:双

`ObservationInfo`-观察信息
表格

此属性是只读的。

观测信息，指定为N.-by-4表，在哪里N.等于输入数据的行数。这ObservationInfo包含该表中描述的列。

列	描述
`重量`	观察权值，作为一个数值指定。默认值为`1`．
`被排除在外`	排除观察的指标，指定为逻辑值。这个值是`真正的`如果你用`“排除”`名称-值对的论点。
`失踪`	缺失观测的指示器，指定为逻辑值。这个值是`真正的`如果观察缺失。
`子集`	拟合函数是否使用观测值的指标，指定为逻辑值。这个值是`真正的`如果未排除或遗漏观测值，则表示拟合函数使用观测值。

要获取这些列中的任何一列作为向量，请使用点表示法在属性中建立索引。例如，获取权值向量W.模型的mdl：

w = mdl.ObservationInfo.Weights

数据类型:表格

`ObservationNames`-观察的名字
字符向量的单元格数组

此属性是只读的。

观察名称，指定为包含拟合中使用的观察名称的字符向量的小区数组。

如果匹配是基于包含观测名称的表或数据集，ObservationNames使用这些名称。
否则,ObservationNames是一个空的单元格阵列。

数据类型:细胞

`PredictorNames`-用于拟合模型的预测器名称
字符向量的单元格数组

此属性是只读的。

用于拟合模型的预测器名称，指定为字符向量的单元数组。

数据类型:细胞

`ractoreName.`-响应变量名
特征向量

此属性是只读的。

响应变量名，指定为字符向量。

数据类型:字符

`VariableInfo`-有关变量的信息
表格

此属性是只读的。

有关包含在的变量的信息变量，指定为一个表，每个变量和表中描述的列对应一行。

列	描述
`类`	可变类，指定为字符向量的单元数组，例如`“双”`和`“分类”`
`范围`	变量范围，指定为向量单元格数组连续变量 - 双元素矢量`[闵那马克斯]`，最小值和最大值分类变量 - 不同的变量值的矢量
`inmodel.`	在拟合模型中的变量的指示符，指定为逻辑向量。这个值是`真正的`如果模型包含变量。
`是基本的`	分类变量的指示符，指定为逻辑向量。这个值是`真正的`如果变量是绝对的。

VariableInfo还包括任何不用于将模型作为预测器或响应拟合模型的变量。

数据类型:表格

`VariableNames`-变量的名字
字符向量的单元格数组

此属性是只读的。

变量名，指定为字符向量的单元格数组。

如果适合基于表或数据集，则此属性提供表或数据集中变量的名称。
如果拟合是基于预测矩阵和响应向量，VariableNames属性指定的值“VarNames”拟合方法的名称-值对参数。的默认值“VarNames”是{x1, x2,…,‘xn’,‘y’}．

VariableNames还包括任何不用于将模型作为预测器或响应拟合模型的变量。

数据类型:细胞

`变量`-输入数据
表格

此属性是只读的。

输入数据，指定为表。变量包含预测器和响应值。如果适合是基于表或数据集数组，变量包含表或数据集数组中的所有数据。否则,变量是从输入数据矩阵创建的表X响应向量y．

变量还包括任何不用于将模型作为预测器或响应拟合模型的变量。

数据类型:表格

对象的功能

展开全部

创建`CompactLinearModel.`

紧凑的 紧线性回归模型

从线性模型中添加或删除条款

`addterms.`	为线性回归模型添加术语
`removeterms.`	从线性回归模型中删除术语
`步`	通过添加或删除术语来改进线性回归模型

预测回应

`函数宏指令`	预测线性回归模型的反应使用一个输入为每个预测器
`预测`	预测线性回归模型的响应
`随机`	用随机噪声模拟线性回归模型的响应

评估线性模型

`方差分析`	线性回归模型的方差分析
`COEFCI.`	线性回归模型系数估计的置信区间
`COLEYEST.`	线性回归模型系数的线性假设检验
`DWTest.`	线性回归模型对象的德宾-沃森检验

可视化线性模型和汇总统计

`情节`	散点图或添加的线性回归模型的可变曲线
`plotAdded`	添加了线性回归模型的变量图
`plotAdjustedResponse`	线性回归模型调整后的响应图
`plotDiagnostics`	绘制线性回归模型的观察诊断图
`丛林意见`	在线性回归模型中绘制预测因子的主要作用
`plotinteraction.`	两个预测因子在线性回归模型的绘图交互效应
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望图(ICE)
`plotResiduals`	线性回归模型的绘图残差
`plotslice.`	通过拟合的线性回归曲面绘制切片图

例子

全部折叠

利用矩阵中的数据拟合线性回归

打开生活的脚本

使用矩阵输入数据集适合线性回归模型。

加载carsmall数据集，一个矩阵输入数据集。

负载carsmallX =(重量、马力、加速度);

使用线性回归模型fitlm．

mdl = fitlm（x，mpg）

MDL =线性回归模型：Y〜1 + x1 + x2 + x3估计系数：estmity se tstat pvalue __________ __________________________0.8785 12.37 4.89574117 0.024313 0.024313 0.024313 0.024313-1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236观测数量：93，误差自由度：89根均匀误差：4.09 R线：0.752，调整R线：0.744 F统计与常数型号：90，p值= 7.38e-27

模型显示包括模型公式、估计系数和模型汇总统计。

显示屏中的型号公式，Y ~ 1 + x1 + x2 + x3,对应于 $y = β_{0.} + β_{1} X_{1} + β_{2} X_{2} + β_{3.} X_{3.} + ϵ$ ．

模型显示还显示了存储在中的估计系数信息系数财产。显示系数财产。

mdl.coffients.

ans =4×4表e- x x x x x x x x x x x x x x x x x

这系数属性包括以下列:

估计- 模型中每个对应项的系数估计。例如，常数项的估计（拦截)是47.977。
SE- 系数的标准错误。
Tstat.-T.-每个系数的统计量，以测试对应系数为零的零假设，相对于它不为零的替代，给定模型中的其他预测器。请注意,tstat =估计/ se．例如T.- 截距的间距为47.977 / 3.8785 = 12.37。
pValue-P.- 为valueT.-对应系数是否等于零的假设检验的统计量。例如P.价值的T.- 艺术性X2大于0.05，因此相对于模型中其他项，该项在5%显著水平下不显著。

模型汇总统计如下:

数量的观察-没有任何的行数南值。例如,数量的观察是93，因为英里/加仑数据向量有6个南价值和马力数据矢量有一个南值，其中行数X和英里/加仑是100。
误差自由度-N.-P.,在那里N.是观察的次数，和P.为模型中系数的个数，包括截距。例如，这个模型有四个预测因子，所以误差自由度是93 - 4 = 89。
根均匀误差-均方误差的平方根，估计误差分布的标准差。
r-平方和调整后的平方- 分别测定系数和调整的测定系数。例如r-平方值表明，该模型解释了响应变量中大约75%的可变性英里/加仑．
f统计量与常数模型-测试统计F-对回归模型的检验，检验模型是否明显优于仅包含常数项的退化模型。
假定值-P.- 为valueF-测试模型。例如，模型是有意义的P.- 7.3816E-27的价值。

您可以在模型属性中找到这些统计信息（numobservations.那DFE.那RMSE,Rsquared)，并使用方差分析功能。

方差分析(mdl“摘要”的）

ans =3×5表SumSq DF MeanSq F pValue ________ ______ ______ __________ Total 6004.8 92 65.269 Model 4516 3 1505.3 89.987 7.3816e-27 Residual 1488.8 89 16.728

线性回归与分类预测

打开生活的脚本

拟合一个包含分类预测器的线性回归模型。对分类预测器的类别重新排序，以控制模型中的参考级别。然后,用方差分析检验分类变量的显著性。

分类预测器模型

加载carsmall数据集并建立线性回归模型英里/加仑作为…的函数Model_Year．处理数值向量Model_Year作为一个分类变量，确定预测器使用“CategoricalVars”名称-值对的论点。

负载carsmallmdl = fitlm（model_year，mpg，“CategoricalVars”，1，“VarNames”, {“Model_Year”那'mpg'}）

mdl =线性回归模型:MPG ~ 1 + Model_Year Estimated Coefficients: Estimate SE tStat pValue ________ ______ ______ __________ (Intercept) 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 3.8839 1.4059 2.7625 0.0069402 Model_Year_82 14.02 1.4369 9.7571 8.2164e-16观测数:94，误差自由度:91均方根误差:5.56 R-squared: 0.531, Adjusted R-squared: 0.521 F-statistic vs. constant model: 51.6, p-value = 1.07e-15

显示屏中的型号公式，MPG ~ 1 + Model_Year,对应于

$英里/加仑 = β_{0.} + β_{1} Ι_{一年 = 76.} + β_{2} Ι_{一年 = 82.} + ϵ$ 那

在哪里 $Ι_{一年 = 76.}$ 和 $Ι_{一年 = 82.}$ 值为1的指示器变量是否为Model_Year分别是76和82。这Model_Year变量包括三个不同的值，您可以通过使用该值来检查独特的功能。

独特的(Model_Year)

ANS =.3×170 76 82

fitlm选择中最小的值Model_Year作为参考水平('70')，并创建两个指示器变量 $Ι_{一年 = 76.}$ 和 $Ι_{一年 = 82.}$ ．该模型只包含两个指标变量，因为如果模型包含三个指标变量(每个水平一个)和一个截距项，设计矩阵就会变得秩不足。

全指标变量模型

您可以解释模型公式mdl作为一个模型，它有三个指标变量，没有截距项:

$y = β_{0.} Ι_{X_{1} = 70} + （ β_{0.} + β_{1} 的） Ι_{X_{1} = 76.} + （ {β_{0.} + β}_{2} 的） Ι_{X_{2} = 82.} + ϵ$ ．

或者，您可以通过手工创建指标变量并指定模型公式来创建一个包含三个指标变量且没有截距项的模型。

temp_Year = dummyvar(分类(Model_Year));Model_Year_70 = temp_Year (: 1);Model_Year_76 = temp_Year (:, 2);Model_Year_82 = temp_Year (: 3);台=表(Model_Year_70 Model_Year_76、Model_Year_82 MPG);mdl = fitlm(资源描述,'MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 - 1'的）

mdl =线性回归模型:MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 Estimated Coefficients: Estimate SE tStat pValue ________ _______ ______ __________ Model_Year_70 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 21.574 0.95387 22.617 4.0156e-39 Model_Year_82 31.71 0.99896 31.743 5.2234e-51观测值:94、误差自由度:91均方根误差:5.56

在模型中选择参考级别

您可以通过修改分类变量中的类别顺序选择参考级别。首先，创建一个分类变量一年．

年=分类(Model_Year);

属性检查类别的顺序类别功能。

类别(年)

ANS =.3 x1单元阵列””{70}{76}{82 '}

如果你使用一年作为预测变量，那么fitlm选择第一个类别'70'作为参考水平。重新排序一年通过使用reordercats功能。

Year_reordered = reordercats(一年,{“76”那'70'那“82”}）;类别（年份）

ANS =.3 x1单元阵列{'76'} {'70'} {'82'}

第一类年份，是“76”．创建的线性回归模型英里/加仑作为…的函数年份，．

mdl2 = fitlm (Year_reordered MPG,“VarNames”, {“Model_Year”那'mpg'}）

MDL2 =线性回归模型：MPG〜1 + Model_year估计系数：估计SE TSTAT PVALUE ___________________________________________70 -3.8839 1.4059 -2.7620 0.136 1.3812 7.3385 8.7634E-11观察数：94，误差自由度：91根均匀误差：5.56 R线：0.531，调整R线：0.521 F统计与常数型号：51.6，P值= 1.07e-15

mdl2使用“76”作为参考水平，包括两个指标变量 $Ι_{一年 = 70}$ 和 $Ι_{一年 = 82.}$ ．

评估分类预测

模型显示mdl2包括一个P.-每一项的值，以检验对应的系数是否等于零。每一个P.-value检查每个指示器变量。检查分类变量Model_Year作为一组指标变量，使用方差分析．使用'成分'(默认)选项返回组件方差分析表，其中包括模型中除常数项外的每个变量的方差分析统计数据。

ANOVA（MDL2，'成分'的）

ans =2×5表SumSq DF MeanSq F pValue ________ ______ _____ __________ Model_Year 3190.1 2 1595.1 51.56 1.0694e-15错误2815.2 91 30.936

组件ANOVA表包括P.价值的Model_Year变量，小于P.-指标变量的值。

拟合稳健线性回归模型

打开生活的脚本

加载hal数据集，测量水泥成分对其硬化热的影响。

负载hal

这个数据集包括变量成分和热．矩阵成分含有水泥中四种化学物质的百分比。向量热包含每个水泥样品在180天后的热硬化值。

对数据拟合一个稳健的线性回归模型。

mdl = fitlm(成分、热、'抢劫'那'在'的）

MDL =线性回归模型（鲁棒配合）：Y〜1个+ X1 + X2 + X3 + X4估计系数：估计SE TSTAT p值________ _______ ________（截距）60.09 75.818 0.79256 0.4509 X1 1.5753 0.80585 1.9548 0.086346×2 0.5322 0.78315 0.67957 0.51596 X30.1346 0.8166 0.16343 0.87424 x4 -0.87424 x4 -0.12052 0.7672 -0.15709 0.87906观测数量：13，误差自由度：8根均匀误差：2.65 r断层：0.979，调整R线：0.969 F统计与常数型号：94.6，p值= 9.03e-07

有关更多细节，请参阅主题强大的回归 - 减少异常效果，将稳健拟合的结果与标准最小二乘拟合的结果进行比较。

用逐步回归拟合线性模型

打开生活的脚本

加载hal数据集，测量水泥成分对其硬化热的影响。

负载hal

这个数据集包括变量成分和热．矩阵成分含有水泥中四种化学物质的百分比。向量热包含每个水泥样品在180天后的热硬化值。

对数据拟合一个逐步线性回归模型。指定0.06作为向模型添加术语的条件的阈值。

mdl = stepwiselm(成分、热、“囚禁”, 0.06)

1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-063 .添加x2, FStat = 5.0259, pValue = 0.051687移除x4, FStat = 1.8633, pValue = 0.2054

mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue  ________ ________ ______ __________ ( 拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979，调整后的R-Squared: 0.974 F-statistic vs. constant model: 230, p-value = 4.41e-09

默认情况下，启动模型是常量模型。stepwiselm执行前进选择并添加X4那X1,X2项(按那个顺序)，因为相应的P.-值小于被关闭的价值0.06。stepwiselm然后使用反向消除和删除X4因为，曾经X2在模型中，P.价值的X4大于默认值PRemove0.1点。

选择功能

为减少在高维数据集上的计算时间，拟合线性回归模型使用fitrlinear功能。
要使回归规则化，请使用fitrlinear那套索那岭，或者plsregress．
- fitrlinear使用套索或脊回归对高维数据集进行正常化。
- 套索使用套索或弹性网去除线性回归中多余的预测。
- 岭使用岭回归将回归与相关项正则化。
- plsregress用偏最小二乘正则化相关项的回归。

扩展能力

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项及限制:

这预测和随机函数支持代码生成。金宝app
当你用fitlm或stepwiselm，您无法在包含逻辑向量，字符数组，分类数组，字符串数组或字符向量的表中提供培训数据。此外，你不能使用“CategoricalVars”名称-值对的论点。代码生成不支持分类预测器。金宝app要在模型中包含范畴预测因子，使用戴维尔在拟合模型之前。

有关更多信息，请参见代码生成简介．

也可以看看

CompactLinearModel.|fitlm|stepwiselm

LinearModel

描述

创建

特性

系数估计

CoefficientCovariance-系数估计的协方差矩阵数字矩阵

CoefficientNames-系数的名字字符向量的单元格数组

系数-系数值表格

numcoffients.-模型系数数正整数

NumEstimatedCoefficients-估计系数数正整数

摘要统计信息

DFE.-误差的自由度正整数

诊断-观察诊断表格

安装-根据输入数据拟合响应值数值向量

LogLikelihood-loglikelihie数值

ModelCriterion-模型比较标准结构

均方误差-均方误差数值

剩余物-拟合模型的残差表格

RMSE-根均匀误差数值

Rsquared-模型的r形值结构

上交所-误差平方和数值

苏维埃社会主义共和国-回归平方和数值

风场-总平方和数值

拟合方法

健壮的-强大的拟合信息结构

步骤-分段拟合的信息结构

输入数据

公式-模型信息LinearFormula目的

numobservations.-数量的观察正整数

numpredictors.-预测变量数正整数

numvarialbles.-变量数量正整数

ObservationInfo-观察信息表格

ObservationNames-观察的名字字符向量的单元格数组

PredictorNames-用于拟合模型的预测器名称字符向量的单元格数组

ractoreName.-响应变量名特征向量

VariableInfo-有关变量的信息表格

VariableNames-变量的名字字符向量的单元格数组

变量-输入数据表格

对象的功能

创建CompactLinearModel.

从线性模型中添加或删除条款

预测回应

评估线性模型

可视化线性模型和汇总统计

例子

利用矩阵中的数据拟合线性回归

线性回归与分类预测

拟合稳健线性回归模型

用逐步回归拟合线性模型

更多关于

术语矩阵

选择功能

扩展能力

C / c++代码生成使用MATLAB®Coder™生成C和c++代码。

也可以看看

话题

介绍了R2012a

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB

`CoefficientCovariance`-系数估计的协方差矩阵
数字矩阵

`CoefficientNames`-系数的名字
字符向量的单元格数组

`系数`-系数值
表格

`numcoffients.`-模型系数数
正整数

`NumEstimatedCoefficients`-估计系数数
正整数

`DFE.`-误差的自由度
正整数

`诊断`-观察诊断
表格

`安装`-根据输入数据拟合响应值
数值向量

`LogLikelihood`-loglikelihie
数值

`ModelCriterion`-模型比较标准
结构

`均方误差`-均方误差
数值

`剩余物`-拟合模型的残差
表格

`RMSE`-根均匀误差
数值

`Rsquared`-模型的r形值
结构

`上交所`-误差平方和
数值

`苏维埃社会主义共和国`-回归平方和
数值

`风场`-总平方和
数值

`健壮的`-强大的拟合信息
结构

`步骤`-分段拟合的信息
结构

`公式`-模型信息
`LinearFormula`目的

`numobservations.`-数量的观察
正整数

`numpredictors.`-预测变量数
正整数

`numvarialbles.`-变量数量
正整数

`ObservationInfo`-观察信息
表格

`ObservationNames`-观察的名字
字符向量的单元格数组

`PredictorNames`-用于拟合模型的预测器名称
字符向量的单元格数组

`ractoreName.`-响应变量名
特征向量

`VariableInfo`-有关变量的信息
表格

`VariableNames`-变量的名字
字符向量的单元格数组

`变量`-输入数据
表格

创建`CompactLinearModel.`

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。