主要内容

回归

多元线性回归

描述

例子

b=回归(y,X)返回一个向量b多元线性回归的系数估计反应的向量y在预测矩阵X。计算系数的估计模型与一个常数项(拦截),包括一个列的矩阵X

(b,少女)=回归(y,X)还返回一个矩阵少女95%置信区间的系数估计。

(b,少女,r)=回归(y,X)返回一个额外的向量r残差。

例子

(b,少女,r,无线电侦察)=回归(y,X)还返回一个矩阵无线电侦察的间隔,可以用来诊断异常值。

例子

(b,少女,r,无线电侦察,统计数据)=回归(y,X)还返回一个向量统计数据包含R2统计,F统计量及其p值,误差方差的估计。矩阵X必须包含一个列的正确统计软件的计算模型。

例子

(___)=回归(y,X,α)使用一个100 *(1α)%置信度计算少女无线电侦察。指定的任何输出参数组合在前面的语法。

例子

全部折叠

加载carsmall数据集。确定重量和功率预测和里程响应。

负载carsmallx1 =重量;x2 =马力;%包含南数据y = MPG;

计算回归系数的线性模型的交互项。

X =[(大小(x1)) (x1, x2) x1。* x2);b =回归(y, X)%去除南数据
b =4×160.7104 -0.0102 -0.1882 0.0000

数据和模型的阴谋。

scatter3 (x1, x2, y,“填充”)举行x1fit = min (x1): 100:马克斯(x1);x2fit = min (x2): 10:马克斯(x2);[X1FIT, X2FIT] = meshgrid (X1FIT X2FIT);YFIT = b (1) + (2) * X1FIT + b (3) * X2FIT + b (4) * X1FIT。* X2FIT;网格(X1FIT X2FIT YFIT)包含(“重量”)ylabel (“马力”)zlabel (“英里”10)视图(50岁)

图包含一个坐标轴对象。坐标轴对象包含重量,ylabel马力包含2类型的对象分散、表面。

加载examgrades数据集。

负载examgrades

使用最后的考试成绩作为响应数据和前两个考试分数预测数据。

y =成绩(:5);X =[(大小(成绩(:1)))的成绩(:1:2)];

进行多元线性回归与α= 0.01。

[~,~,r,无线电侦察]=回归(y、X 0.01);

诊断异常值通过寻找剩余的间隔无线电侦察不含0。

contain0 =(无线电侦察(:1)< 0 &无线电侦察(:,2)> 0);idx =找到(contain0 = = false)
idx =2×153 54

观察5354可能是离群值。

创建一个残差的散点图。填写相对应的点离群值。

持有散射(y, r)散射(y (idx)、r (idx),“b”,“填充”)包含(“最后考试成绩”)ylabel (“残差”)举行

图包含一个坐标轴对象。坐标轴对象包含最后的考试成绩,ylabel残差包含2散射类型的对象。

加载哈尔德使用数据集。作为响应变量和成分预测数据。

负载哈尔德y =热量;X1 =成分;x1 = 1(大小(x1, 1), 1);X = (x1 x1);%包括列的

进行多元线性回归和统计数据生成模型。

[~,~,~,~,统计]=回归(y, X)
统计=1×40.9824 111.4792 0.0000 5.9830

因为 R 2 的价值0.9824接近于1,p -的价值0.0000小于0.05的默认显著性水平,响应之间存在显著的线性回归关系y和预测变量X

输入参数

全部折叠

响应数据,指定为一个n1数字向量。行y对应于不同的观察结果。y必须有相同数量的行吗X

数据类型:|

预测数据,指定为一个n——- - - - - -p数字矩阵。行X对应于观测,和列对应于预测变量。X必须有相同数量的行吗y

数据类型:|

显著性水平,指定为一个积极的标量。α必须在0和1之间。

数据类型:|

输出参数

全部折叠

多元线性回归系数的估计,作为一个数值向量返回。b是一个p1的向量,p预测的数量吗X。如果列X是线性相关的,回归集的元素的最大数量b为零。

数据类型:

上下信心边界系数估计,作为一个数字矩阵返回。少女是一个p2矩阵,p预测的数量吗X。第一列的少女包含每个系数的估计范围较低的信心;第二列包含边界上的信心。如果列X是线性相关的,回归返回元素的零少女对应的零元素b

数据类型:

残差,作为数字返回向量。r是一个n1的向量,n是观测的数量,或行吗X

数据类型:|

间隔诊断异常值,返回一个数字矩阵。无线电侦察是一个n2矩阵,n是观测的数量,或行吗X。如果时间间隔无线电侦察(我,:)为观察不包含零,相应的剩余大于预期在吗100 *(1α)%的新观测,表明一个异类。有关更多信息,请参见算法

数据类型:|

模型的统计数据,作为一个数值向量包括返回R2统计,F统计量及其p值,误差方差的估计。

  • X必须包含一个列的模型包含一个常数项。的F统计量及其p价值计算在这个假设和不正确的模型没有一个常数。

  • F统计量的检验统计量F以及回归模型。的F以及寻找之间有显著的线性回归关系响应变量和预测变量。

  • R2统计数据可以为阴性模型没有一个常数,表明该模型不适合数据。

数据类型:|

提示

  • 回归对待Xy作为缺失值。回归省略了观察与缺失值回归健康。

算法

全部折叠

剩余时间间隔

在一个线性模型中,观察到的值y和他们的残差是随机变量。残差和零均值正态分布,但不同的差异在不同的值的预测。同等规模的残差,回归“Studentizes”剩余工资。也就是说,回归将估计的残差的标准差,是独立的价值。Studentized残差有t分布与已知的自由度。在返回的时间间隔无线电侦察是变化的100 *(1α)%的置信区间t残差分布,集中。

选择功能

回归是有用的,当你只需要函数的输出参数,当你想在一个循环中重复多次拟合模型。如果你需要进一步调查合身的回归模型,创建一个线性回归模型对象LinearModel通过使用fitlmstepwiselm。一个LinearModel对象提供了更多的功能回归

  • 使用的属性LinearModel拟合线性回归模型进行调查。对象属性包括系数估计信息,汇总统计,拟合方法,输入数据。

  • 使用对象的功能LinearModel预测反应和修改、评价和可视化的线性回归模型。

  • 不像回归,fitlm函数不需要的输入数据的列。一个模型是由fitlm总是包含一个拦截术语,除非你指定不包括通过使用“拦截”名称-值对的论点。

  • 你可以找到的信息的输出回归使用属性和对象的功能LinearModel

    的输出回归 等效值LinearModel
    b 看到估计列的系数财产。
    少女 使用coefCI函数。
    r 看到列的残差财产。
    无线电侦察 不受支持金宝app的。相反,使用studentized残差(残差属性)和观察诊断(诊断属性)发现异常值。
    统计数据 显示在命令窗口中看到该模型。你可以找到数据模型属性(均方误差Rsquared),并通过使用方差分析函数。

引用

[1]Chatterjee, S。a, s·哈迪。“有影响力的观察,高杠杆点,离群值线性回归。”统计科学。1卷,1986年,页379 - 416。

扩展功能

版本历史

之前介绍过的R2006a