线性回归模型
LinearModel
是一个拟合的线性回归模型对象。回归模型描述了响应和预测因子之间的关系。线性回归模型中的线性度是指预测器系数的线性度。
使用a的属性LinearModel
摘要目的探讨拟合的线性回归模型。对象属性包括关于系数估计、汇总统计、拟合方法和输入数据的信息。使用对象函数来预测响应,并修改、评估和可视化线性回归模型。
创建一个LinearModel
对象的使用fitlm
或stepwiselm
.
fitlm
使用固定的模型规范对数据拟合线性回归模型。使用addterms.
那removeterms.
, 或者步
从模型中添加或删除术语。另外,使用stepwiselm
用逐步线性回归拟合模型。
CoefficientCovariance
-系数估计的协方差矩阵CoefficientNames
-系数的名字此属性是只读的。
系数名称,指定为字符向量的单元数组,每个单元包含相应项的名称。
数据类型:细胞
系数
-系数值此属性是只读的。
系数值,指定为表。系数
包含每行系数和这些列:
估计
- 估计系数值
SE
-估计的标准误差
Tstat.
-T.用于测试系数为零的测试
pValue
-P.- 为valueT.-统计
使用方差分析
(仅适用于线性回归模型)或COLEYEST.
对系数进行其他测试。使用COEFCI.
找出系数估计的置信区间。
要获取这些列中的任何一列作为向量,请使用点表示法在属性中建立索引。例如,得到模型中估计的系数向量mdl
:
β= mdl.Coefficients.Estimate
数据类型:表格
numcoffients.
-模型系数数此属性是只读的。
模型系数的数目,指定为正整数。numcoffients.
包括当模型项缺乏等级时设置为零的系数。
数据类型:双
NumEstimatedCoefficients
-估计系数数此属性是只读的。
模型中的估计系数数,指定为正整数。NumEstimatedCoefficients
不包括当模型项缺乏等级时被设为零的系数。NumEstimatedCoefficients
是回归的自由度。
数据类型:双
DFE.
-误差的自由度此属性是只读的。
错误的自由度(残差),等于观察次数减去估计系数的数量,指定为正整数。
数据类型:双
诊断
-观察诊断此属性是只读的。
观察诊断,指定为包含每个观察的一行的表和本表中描述的列。
列 | 意义 | 描述 |
---|---|---|
利用 |
对角元素的Hatmatrix. |
利用 对于每一个观察表明,在何种程度上的拟合是由观察的预测值决定的。接近于1 表示该拟合主要由该观察结果确定,几乎没有其他观察结果的贡献。接近于0. 表明拟合在很大程度上是由其他观察结果决定的。对于具有P. 系数和N. 观察,平均值利用 是P / N .一种利用 值大于2 * P / N 表明高杠杆。 |
CooksDistance |
厨师的距离 | CooksDistance 是对拟合值按比例变化的度量。一个观察CooksDistance 库克距离可能是一个异常值。 |
Dffits |
删除-1比例差异的拟合值 | Dffits 是每个观察的拟合值中的缩放变化,从而排除从拟合的观察结果。值大于2 * sqrt(p / n) 绝对值可以被认为是有影响力的。 |
S2_i |
Delete-1方差 | S2_i 是通过依次删除每次观察来获得的一组残留方差估计。可以将这些估计与存储在中的均方误差(MSE)值进行比较均方误差 财产。 |
CovRatio |
减去-1协方差行列式之比 | CovRatio 为依次删除每个观测值的系数协方差矩阵的行列式与整个模型的协方差矩阵的行列式之比。值大于1 + 3 * P / N 或小于1 - 3 * p / n 表明有影响力的点。 |
Dfbetas |
在系数估计中删除-1缩放差异 | Dfbetas 是一个N. ——- - - - - -P. 由依次排除每个观测结果得出的系数估计中的比例变化矩阵。值大于3 / sqrt(n) 在绝对值上表示观测值对相应系数有显著影响。 |
Hatmatrix. |
要计算的投影矩阵安装 从观察到的响应 |
Hatmatrix. 是一个N. ——- - - - - -N. 矩阵,安装= HatMatrix * Y ,在那里y 是响应矢量和安装 为拟合响应值的向量。 |
诊断
包含有助于发现异常值和有影响的观察结果的信息。Delete-1诊断捕获从匹配中依次排除每个观察结果的变化。有关详细信息,请参见帽子矩阵和杠杆那库克的距离,Delete-1统计.
使用plotDiagnostics
绘制观察诊断图。
由于缺少值而未在适合中使用的行(在ObservationInfo。失踪
)或排除值(在ObservationInfo。被排除在外
)包含南
价值在CooksDistance
那Dffits
那S2_i
,CovRatio
列和零利用
那Dfbetas
,Hatmatrix.
列。
要将任何这些列作为数组,请使用点表示法索引到属性中。例如,在模型中获取删除-1方差向量mdl
:
s2i = mdl.diagnostics.s2_i;
数据类型:表格
安装
-根据输入数据拟合响应值LogLikelihood
-loglikelihie此属性是只读的。
响应值的对数似然,指定为一个数值,基于每个响应值服从正态分布的假设。正态分布的均值是拟合的(预测的)响应值,方差是均方误差
.
数据类型:单身的
|双
ModelCriterion
-模型比较标准此属性是只读的。
模型比较标准,指定为具有以下字段的结构:
另类投资会议
-赤池信息准则。AIC = -2 *logL + 2*m
,在那里logL
loglikelihood和M.
为估计参数的个数。
AICC.
-赤池信息标准修正的样本量。AIC = AIC + (2*m*(m+1))/(n-m-1)
,在那里N.
为观察次数。
BIC.
-贝叶斯信息准则。BIC = -2 *logL + m*log(n)
.
中安集团经贸
- 一致的Akaike信息标准。CAIC = -2 *logL + m*(log(n)+1)
.
信息标准是您可以使用的模型选择工具来比较多个型号适合同一数据。这些标准是基于可能性的模型拟合措施,包括复杂性的惩罚(具体地,参数的数量)。不同的信息标准通过罚款的形式来区分。
当比较多个模型时,信息准则值最低的模型是拟合最好的模型。最佳拟合模型可以根据模型比较所用的标准而变化。
要获取标量形式的任何标准值,请使用点表示法在属性中建立索引。例如,获取AIC值另类投资会议
在模型中mdl
:
AIC = mdl.modelcrertion.aic.
数据类型:塑造
均方误差
-均方误差此属性是只读的。
均方误差(残差),指定为数值。
均方误差=上交所/DFE.那
在哪里均方误差为均方误差,上交所是误差平方和,和DFE.是自由度。
数据类型:单身的
|双
剩余物
-拟合模型的残差此属性是只读的。
拟合模型的残差,指定为一个表,其中包含每个观测的一行和表中描述的列。
列 | 描述 |
---|---|
生的 |
观测减拟合值 |
皮尔森 |
原始残差除以根均方误差(RMSE) |
标准化 |
原始残差除以其估计的标准差 |
Studentized |
原始残余除以残留标准偏差的独立估计。观察的残余一世除以基于除观测外的所有观测的误差标准差的估计值一世. |
使用plotResiduals
绘制残差图。有关详细信息,请参见剩余物.
由于缺少值而未在适合中使用的行(在ObservationInfo。失踪
)或排除值(在ObservationInfo。被排除在外
)包含南
值。
要获取这些列中的任何一列作为向量,请使用点表示法在属性中建立索引。例如,获得原始残留载体R.
在模型中mdl
:
r = mdl.Residuals.Raw
数据类型:表格
RMSE
-根均匀误差此属性是只读的。
均方根误差(残差),指定为一个数值。
RMSE=√均方误差),
在哪里RMSE是根均匀的误差和均方误差为均方误差。
数据类型:单身的
|双
Rsquared
-模型的r形值此属性是只读的。
模型的r平方值,指定为具有两个字段的结构:
普通的
-普通(未调整)r平方
调整
- r平方调整系数的数量
r平方值是模型所解释的总平方和的比例。一般的r平方值与苏维埃社会主义共和国
和风场
属性:
RSQUARED = SSR / SST = 1 - SSE / SST
那
在哪里风场
是总平方和,上交所
是误差平方和,和苏维埃社会主义共和国
为回归平方和。
有关详细信息,请参见确定系数(R角).
要将这些值中的任何一个作为标量,请使用点符号索引到属性中。例如,在模型中获得调整后的R线值mdl
:
r2 = mdl.Rsquared.Adjusted
数据类型:塑造
上交所
-误差平方和此属性是只读的。
误差的平方和(残差),指定为一个数值。
毕达哥拉斯定理意味着
sst = sse + ssr
那
在哪里风场
是总平方和,上交所
是误差平方和,和苏维埃社会主义共和国
为回归平方和。
数据类型:单身的
|双
苏维埃社会主义共和国
-回归平方和此属性是只读的。
回归平方和,指定为一个数值。回归平方和等于拟合值离均值的方差平方和。
毕达哥拉斯定理意味着
sst = sse + ssr
那
在哪里风场
是总平方和,上交所
是误差平方和,和苏维埃社会主义共和国
为回归平方和。
数据类型:单身的
|双
风场
-总平方和此属性是只读的。
用数值指定的平方和的总和。总平方和等于响应向量的偏差平方和y
从意思是(y)
.
毕达哥拉斯定理意味着
sst = sse + ssr
那
在哪里风场
是总平方和,上交所
是误差平方和,和苏维埃社会主义共和国
为回归平方和。
数据类型:单身的
|双
健壮的
-强大的拟合信息此属性是只读的。
鲁棒拟合信息,指定为具有本表中描述字段的结构。
场 | 描述 |
---|---|
WGTFUN. |
鲁棒加权函数,如“bisquare” (见'抢劫' 的) |
调优 |
调整常数。这个字段是空的([] ) 如果WGTFUN. 是'OLS' 或者,如果WGTFUN. 是带有默认调优常数1的自定义权重函数的函数句柄。 |
重量 |
鲁棒拟合最后迭代所用的权值向量。对象的该字段为空CompactLinearModel. 对象。 |
除非您使用强大的回归,否则此结构为空。
数据类型:塑造
步骤
-分段拟合的信息此属性是只读的。
逐步拟合信息,指定为具有表中所述字段的结构。
场 | 描述 |
---|---|
开始 |
表示起始模型的公式 |
降低 |
表示下界模型的公式。的条款降低 必须保持在模型中。 |
上 |
表示上限模型的公式。该模型不能包含更多的术语上 . |
标准 |
准则用于逐步算法,如上交所的 |
被关闭的 |
阈值标准 添加一个术语 |
PRemove |
阈值标准 去掉一个词 |
历史 |
表中表示在适合的步骤 |
这历史
表为每个步骤包含一行,包括初始匹配和表中描述的列。
列 | 描述 |
---|---|
行动 |
步骤中采取的行动:
|
TermName |
|
条款 |
的模型规范术语矩阵 |
DF. |
步后的回归自由度 |
达尔德夫 |
与上一步相比,回归自由度的变化(对于删除一项的步骤为负) |
异常 |
步长偏差(残差平方和)(仅适用于广义线性回归模型) |
函数 |
F-导致步骤的统计数据 |
pvalue. |
P.价值的F-统计 |
除非使用逐步回归,否则结构为空。
数据类型:塑造
公式
-模型信息LinearFormula
目的此属性是只读的。
模型信息,指定为LinearFormula
对象。
显示拟合型号的公式mdl
使用点符号:
mdl。F或M.ula
numobservations.
-数量的观察此属性是只读的。
用于拟合的拟合函数的观测数,指定为正整数。numobservations.
原始表、数据集或矩阵中提供的观察数是否减去任何排除的行(用“排除”
名称-值对参数)或缺少值的行。
数据类型:双
numpredictors.
-预测变量数此属性是只读的。
用于适合模型的预测变量数量指定为正整数。
数据类型:双
numvarialbles.
-变量数量此属性是只读的。
输入数据中的变量数,指定为正整数。numvarialbles.
是原始表或数据集中的变量数,或预测器矩阵和响应矢量中的列总数。
numvarialbles.
还包括任何不用于将模型作为预测器或响应拟合模型的变量。
数据类型:双
ObservationInfo
-观察信息此属性是只读的。
观测信息,指定为N.-by-4表,在哪里N.等于输入数据的行数。这ObservationInfo
包含该表中描述的列。
列 | 描述 |
---|---|
重量 |
观察权值,作为一个数值指定。默认值为1 . |
被排除在外 |
排除观察的指标,指定为逻辑值。这个值是真正的 如果你用“排除” 名称-值对的论点。 |
失踪 |
缺失观测的指示器,指定为逻辑值。这个值是真正的 如果观察缺失。 |
子集 |
拟合函数是否使用观测值的指标,指定为逻辑值。这个值是真正的 如果未排除或遗漏观测值,则表示拟合函数使用观测值。 |
要获取这些列中的任何一列作为向量,请使用点表示法在属性中建立索引。例如,获取权值向量W.
模型的mdl
:
w = mdl.ObservationInfo.Weights
数据类型:表格
ObservationNames
-观察的名字此属性是只读的。
观察名称,指定为包含拟合中使用的观察名称的字符向量的小区数组。
如果匹配是基于包含观测名称的表或数据集,ObservationNames
使用这些名称。
否则,ObservationNames
是一个空的单元格阵列。
数据类型:细胞
PredictorNames
-用于拟合模型的预测器名称此属性是只读的。
用于拟合模型的预测器名称,指定为字符向量的单元数组。
数据类型:细胞
ractoreName.
-响应变量名此属性是只读的。
响应变量名,指定为字符向量。
数据类型:字符
VariableInfo
-有关变量的信息此属性是只读的。
有关包含在的变量的信息变量
,指定为一个表,每个变量和表中描述的列对应一行。
列 | 描述 |
---|---|
类 |
可变类,指定为字符向量的单元数组,例如“双” 和“分类” |
范围 |
变量范围,指定为向量单元格数组
|
inmodel. |
在拟合模型中的变量的指示符,指定为逻辑向量。这个值是真正的 如果模型包含变量。 |
是基本的 |
分类变量的指示符,指定为逻辑向量。这个值是真正的 如果变量是绝对的。 |
VariableInfo
还包括任何不用于将模型作为预测器或响应拟合模型的变量。
数据类型:表格
VariableNames
-变量的名字此属性是只读的。
变量名,指定为字符向量的单元格数组。
如果适合基于表或数据集,则此属性提供表或数据集中变量的名称。
如果拟合是基于预测矩阵和响应向量,VariableNames
属性指定的值“VarNames”
拟合方法的名称-值对参数。的默认值“VarNames”
是{x1, x2,…,‘xn’,‘y’}
.
VariableNames
还包括任何不用于将模型作为预测器或响应拟合模型的变量。
数据类型:细胞
变量
-输入数据此属性是只读的。
输入数据,指定为表。变量
包含预测器和响应值。如果适合是基于表或数据集数组,变量
包含表或数据集数组中的所有数据。否则,变量
是从输入数据矩阵创建的表X
响应向量y
.
变量
还包括任何不用于将模型作为预测器或响应拟合模型的变量。
数据类型:表格
CompactLinearModel.
紧凑的 |
紧线性回归模型 |
addterms. |
为线性回归模型添加术语 |
removeterms. |
从线性回归模型中删除术语 |
步 |
通过添加或删除术语来改进线性回归模型 |
情节 |
散点图或添加的线性回归模型的可变曲线 |
plotAdded |
添加了线性回归模型的变量图 |
plotAdjustedResponse |
线性回归模型调整后的响应图 |
plotDiagnostics |
绘制线性回归模型的观察诊断图 |
丛林意见 |
在线性回归模型中绘制预测因子的主要作用 |
plotinteraction. |
两个预测因子在线性回归模型的绘图交互效应 |
plotPartialDependence |
创建部分依赖图(PDP)和个人条件期望图(ICE) |
plotResiduals |
线性回归模型的绘图残差 |
plotslice. |
通过拟合的线性回归曲面绘制切片图 |
使用矩阵输入数据集适合线性回归模型。
加载carsmall
数据集,一个矩阵输入数据集。
负载carsmallX =(重量、马力、加速度);
使用线性回归模型fitlm
.
mdl = fitlm(x,mpg)
MDL =线性回归模型:Y〜1 + x1 + x2 + x3估计系数:estmity se tstat pvalue __________ __________________________0.8785 12.37 4.89574117 0.024313 0.024313 0.024313 0.024313-1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236观测数量:93,误差自由度:89根均匀误差:4.09 R线:0.752,调整R线:0.744 F统计与常数型号:90,p值= 7.38e-27
模型显示包括模型公式、估计系数和模型汇总统计。
显示屏中的型号公式,Y ~ 1 + x1 + x2 + x3
,对应于
.
模型显示还显示了存储在中的估计系数信息系数
财产。显示系数
财产。
mdl.coffients.
ans =4×4表e- x x x x x x x x x x x x x x x x x
这系数
属性包括以下列:
估计
- 模型中每个对应项的系数估计。例如,常数项的估计(拦截
)是47.977。
SE
- 系数的标准错误。
Tstat.
-T.-每个系数的统计量,以测试对应系数为零的零假设,相对于它不为零的替代,给定模型中的其他预测器。请注意,tstat =估计/ se
.例如T.- 截距的间距为47.977 / 3.8785 = 12.37。
pValue
-P.- 为valueT.-对应系数是否等于零的假设检验的统计量。例如P.价值的T.- 艺术性X2
大于0.05,因此相对于模型中其他项,该项在5%显著水平下不显著。
模型汇总统计如下:
数量的观察
-没有任何的行数南
值。例如,数量的观察
是93,因为英里/加仑
数据向量有6个南
价值和马力
数据矢量有一个南
值,其中行数X
和英里/加仑
是100。
误差自由度
-N.-P.,在那里N.是观察的次数,和P.为模型中系数的个数,包括截距。例如,这个模型有四个预测因子,所以误差自由度
是93 - 4 = 89。
根均匀误差
-均方误差的平方根,估计误差分布的标准差。
r-平方
和调整后的平方
- 分别测定系数和调整的测定系数。例如r-平方
值表明,该模型解释了响应变量中大约75%的可变性英里/加仑
.
f统计量与常数模型
-测试统计F-对回归模型的检验,检验模型是否明显优于仅包含常数项的退化模型。
假定值
-P.- 为valueF-测试模型。例如,模型是有意义的P.- 7.3816E-27的价值。
您可以在模型属性中找到这些统计信息(numobservations.
那DFE.
那RMSE
,Rsquared
),并使用方差分析
功能。
方差分析(mdl“摘要”的)
ans =3×5表SumSq DF MeanSq F pValue ________ ______ ______ __________ Total 6004.8 92 65.269 Model 4516 3 1505.3 89.987 7.3816e-27 Residual 1488.8 89 16.728
拟合一个包含分类预测器的线性回归模型。对分类预测器的类别重新排序,以控制模型中的参考级别。然后,用方差分析
检验分类变量的显著性。
分类预测器模型
加载carsmall
数据集并建立线性回归模型英里/加仑
作为…的函数Model_Year
.处理数值向量Model_Year
作为一个分类变量,确定预测器使用“CategoricalVars”
名称-值对的论点。
负载carsmallmdl = fitlm(model_year,mpg,“CategoricalVars”,1,“VarNames”, {“Model_Year”那'mpg'})
mdl =线性回归模型:MPG ~ 1 + Model_Year Estimated Coefficients: Estimate SE tStat pValue ________ ______ ______ __________ (Intercept) 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 3.8839 1.4059 2.7625 0.0069402 Model_Year_82 14.02 1.4369 9.7571 8.2164e-16观测数:94,误差自由度:91均方根误差:5.56 R-squared: 0.531, Adjusted R-squared: 0.521 F-statistic vs. constant model: 51.6, p-value = 1.07e-15
显示屏中的型号公式,MPG ~ 1 + Model_Year
,对应于
那
在哪里
和
值为1的指示器变量是否为Model_Year
分别是76和82。这Model_Year
变量包括三个不同的值,您可以通过使用该值来检查独特的
功能。
独特的(Model_Year)
ANS =.3×170 76 82
fitlm
选择中最小的值Model_Year
作为参考水平('70'
),并创建两个指示器变量
和
.该模型只包含两个指标变量,因为如果模型包含三个指标变量(每个水平一个)和一个截距项,设计矩阵就会变得秩不足。
全指标变量模型
您可以解释模型公式mdl
作为一个模型,它有三个指标变量,没有截距项:
.
或者,您可以通过手工创建指标变量并指定模型公式来创建一个包含三个指标变量且没有截距项的模型。
temp_Year = dummyvar(分类(Model_Year));Model_Year_70 = temp_Year (: 1);Model_Year_76 = temp_Year (:, 2);Model_Year_82 = temp_Year (: 3);台=表(Model_Year_70 Model_Year_76、Model_Year_82 MPG);mdl = fitlm(资源描述,'MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 - 1'的)
mdl =线性回归模型:MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 Estimated Coefficients: Estimate SE tStat pValue ________ _______ ______ __________ Model_Year_70 17.69 1.0328 17.127 3.2371e-30 Model_Year_76 21.574 0.95387 22.617 4.0156e-39 Model_Year_82 31.71 0.99896 31.743 5.2234e-51观测值:94、误差自由度:91均方根误差:5.56
在模型中选择参考级别
您可以通过修改分类变量中的类别顺序选择参考级别。首先,创建一个分类变量一年
.
年=分类(Model_Year);
属性检查类别的顺序类别
功能。
类别(年)
ANS =.3 x1单元阵列””{70}{76}{82 '}
如果你使用一年
作为预测变量,那么fitlm
选择第一个类别'70'
作为参考水平。重新排序一年
通过使用reordercats
功能。
Year_reordered = reordercats(一年,{“76”那'70'那“82”});类别(年份)
ANS =.3 x1单元阵列{'76'} {'70'} {'82'}
第一类年份,
是“76”
.创建的线性回归模型英里/加仑
作为…的函数年份,
.
mdl2 = fitlm (Year_reordered MPG,“VarNames”, {“Model_Year”那'mpg'})
MDL2 =线性回归模型:MPG〜1 + Model_year估计系数:估计SE TSTAT PVALUE ___________________________________________70 -3.8839 1.4059 -2.7620 0.136 1.3812 7.3385 8.7634E-11观察数:94,误差自由度:91根均匀误差:5.56 R线:0.531,调整R线:0.521 F统计与常数型号:51.6,P值= 1.07e-15
mdl2
使用“76”
作为参考水平,包括两个指标变量
和
.
评估分类预测
模型显示mdl2
包括一个P.-每一项的值,以检验对应的系数是否等于零。每一个P.-value检查每个指示器变量。检查分类变量Model_Year
作为一组指标变量,使用方差分析
.使用'成分'
(默认)选项返回组件方差分析表,其中包括模型中除常数项外的每个变量的方差分析统计数据。
ANOVA(MDL2,'成分'的)
ans =2×5表SumSq DF MeanSq F pValue ________ ______ _____ __________ Model_Year 3190.1 2 1595.1 51.56 1.0694e-15错误2815.2 91 30.936
组件ANOVA表包括P.价值的Model_Year
变量,小于P.-指标变量的值。
加载hal
数据集,测量水泥成分对其硬化热的影响。
负载hal
这个数据集包括变量成分
和热
.矩阵成分
含有水泥中四种化学物质的百分比。向量热
包含每个水泥样品在180天后的热硬化值。
对数据拟合一个稳健的线性回归模型。
mdl = fitlm(成分、热、'抢劫'那'在'的)
MDL =线性回归模型(鲁棒配合):Y〜1个+ X1 + X2 + X3 + X4估计系数:估计SE TSTAT p值________ _______ ________(截距)60.09 75.818 0.79256 0.4509 X1 1.5753 0.80585 1.9548 0.086346×2 0.5322 0.78315 0.67957 0.51596 X30.1346 0.8166 0.16343 0.87424 x4 -0.87424 x4 -0.12052 0.7672 -0.15709 0.87906观测数量:13,误差自由度:8根均匀误差:2.65 r断层:0.979,调整R线:0.969 F统计与常数型号:94.6,p值= 9.03e-07
有关更多细节,请参阅主题强大的回归 - 减少异常效果,将稳健拟合的结果与标准最小二乘拟合的结果进行比较。
加载hal
数据集,测量水泥成分对其硬化热的影响。
负载hal
这个数据集包括变量成分
和热
.矩阵成分
含有水泥中四种化学物质的百分比。向量热
包含每个水泥样品在180天后的热硬化值。
对数据拟合一个逐步线性回归模型。指定0.06作为向模型添加术语的条件的阈值。
mdl = stepwiselm(成分、热、“囚禁”, 0.06)
1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-063 .添加x2, FStat = 5.0259, pValue = 0.051687移除x4, FStat = 1.8633, pValue = 0.2054
mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue ________ ________ ______ __________ ( 拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979,调整后的R-Squared: 0.974 F-statistic vs. constant model: 230, p-value = 4.41e-09
默认情况下,启动模型是常量模型。stepwiselm
执行前进选择并添加X4
那X1
,X2
项(按那个顺序),因为相应的P.-值小于被关闭的
价值0.06。stepwiselm
然后使用反向消除和删除X4
因为,曾经X2
在模型中,P.价值的X4
大于默认值PRemove
0.1点。
一个条件矩阵T.
是A.T.————(P.+ 1)指定模型中的项的矩阵,其中T.是术语数,P.为预测变量的个数,+1表示响应变量。的价值T (i, j)
是变量的指数j
术语一世
.
例如,假设一个输入包含三个预测变量一种
那B.
,C
和响应变量y
按顺序一种
那B.
那C
,y
.每一行的T.
代表一个术语:
[0 0 0]
-常数项或截距
[0 1 0 0]
-B.
;同样,A^0 * b ^1 * c ^0
[1 0 1 0]
-* C
[2 0 0]
-^ 2
[0 1 2 0]
-B * (C ^ 2)
这0.
在每一项的末尾表示响应变量。通常,项矩阵中的零列向量表示响应变量的位置。如果在矩阵和列向量中有预测器和响应变量,则必须包括0.
对于每行最后一列中的响应变量。
为减少在高维数据集上的计算时间,拟合线性回归模型使用fitrlinear
功能。
要使回归规则化,请使用fitrlinear
那套索
那岭
, 或者plsregress
.
fitrlinear
使用套索或脊回归对高维数据集进行正常化。
套索
使用套索或弹性网去除线性回归中多余的预测。
岭
使用岭回归将回归与相关项正则化。
plsregress
用偏最小二乘正则化相关项的回归。
使用注意事项及限制:
当你用fitlm
或stepwiselm
,您无法在包含逻辑向量,字符数组,分类数组,字符串数组或字符向量的表中提供培训数据。此外,你不能使用“CategoricalVars”
名称-值对的论点。代码生成不支持分类预测器。金宝app要在模型中包含范畴预测因子,使用戴维尔
在拟合模型之前。
有关更多信息,请参见代码生成简介.
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。