威尔金森表示法提供了一种描述回归和重复度量模型而不指定系数值的方法。这种专门的符号识别响应变量,以及在模型中包含或排除哪些预测变量。您还可以在模型公式中包括平方项和高阶项、交互项和分组变量。gydF4y2Ba
使用Wilkinson表示法指定模型有以下几个优点:gydF4y2Ba
您可以在模型中包含或排除单个预测器和交互术语。例如,使用gydF4y2Ba“互动”gydF4y2Ba
每个模型拟合函数中可用的名称值对包括所有变量对的交互术语。使用Wilkinson表示法允许您仅包括互动的兴趣条款。gydF4y2Ba
如果输入数据使用,则可以在不更改设计矩阵的情况下更改型号公式gydF4y2Ba桌子gydF4y2Ba
数据类型。例如,如果使用所有可用的预测器变量适合初始模型,但决定删除没有统计学意义的变量,则可以重新编写型号公式,仅包括感兴趣的变量。您无需对输入数据本身进行任何更改。gydF4y2Ba
统计和机器学习工具箱™提供了几个使用Wilkinson符号的模型拟合功能,包括:gydF4y2Ba
线性模型(使用gydF4y2BafitlmgydF4y2Ba
和gydF4y2Ba步骤行程gydF4y2Ba
)gydF4y2Ba
广义线性模型(使用gydF4y2BafitglmgydF4y2Ba
)gydF4y2Ba
线性混合效应模型(使用gydF4y2Bafitlme.gydF4y2Ba
和gydF4y2BafitlmematrixgydF4y2Ba
)gydF4y2Ba
广义的线性混合效果模型(使用gydF4y2BaFitglme.gydF4y2Ba
)gydF4y2Ba
重复测量模型(使用gydF4y2BaFitrm.gydF4y2Ba
)gydF4y2Ba
模型规范的公式是形式的字符向量或字符串标量gydF4y2Bay ~条款gydF4y2Ba
,在那里gydF4y2BaygydF4y2Ba
是响应变量的名称,以及gydF4y2Ba条款gydF4y2Ba
使用预测器变量名和以下操作符定义模型。gydF4y2Ba
模型中的预测项gydF4y2Ba | 威尔金森符号gydF4y2Ba |
---|---|
拦截gydF4y2Ba | 1gydF4y2Ba |
没有拦截gydF4y2Ba | 1gydF4y2Ba |
xgydF4y2Ba1gydF4y2Ba | x1gydF4y2Ba |
xgydF4y2Ba1gydF4y2Ba,gydF4y2BaxgydF4y2Ba2gydF4y2Ba | x1 + x2gydF4y2Ba |
xgydF4y2Ba1gydF4y2Ba,gydF4y2BaxgydF4y2Ba2gydF4y2Ba,gydF4y2BaxgydF4y2Ba1gydF4y2BaxgydF4y2Ba2gydF4y2Ba | x1 * x2gydF4y2Ba 或者gydF4y2BaX1 + x2 + X1:x2gydF4y2Ba |
xgydF4y2Ba1gydF4y2BaxgydF4y2Ba2gydF4y2Ba | x1:x2gydF4y2Ba |
xgydF4y2Ba1gydF4y2Ba,gydF4y2BaxgydF4y2Ba1gydF4y2Ba2gydF4y2Ba | x1 ^ 2gydF4y2Ba |
xgydF4y2Ba1gydF4y2Ba2gydF4y2Ba | x1 ^ 2 - x1gydF4y2Ba |
Wilkinson表记法默认情况下在模型中包含一个截距项,即使您没有在模型公式中添加1。要从模型中排除截距,在公式中使用-1。gydF4y2Ba
的gydF4y2Ba*gydF4y2Ba
操作符(用于交互)和gydF4y2Ba^gydF4y2Ba
运算符(用于幂和指数)自动包含所有低阶项。例如,如果您指定gydF4y2Bax ^ 3gydF4y2Ba
,该模型将自动包含gydF4y2BaxgydF4y2Ba3.gydF4y2Ba,gydF4y2BaxgydF4y2Ba2gydF4y2Ba, 和gydF4y2BaxgydF4y2Ba.如果您想从模型中排除某些变量,请使用gydF4y2Ba- - - - - -gydF4y2Ba
操作符删除不需要的术语。gydF4y2Ba
对于随机效果和混合效果模型,公式规范包括预测变量的名称和分组变量。例如,如果预测器变量gydF4y2BaxgydF4y2Ba1gydF4y2Ba随机效应是由变量分组的吗gydF4y2BaggydF4y2Ba然后在Wilkinson符号中代表这一点,如下所示:gydF4y2Ba
(x1 | g)gydF4y2Ba
对于重复测量模型,公式规范将所有重复测量作为响应,并将因子作为预测变量。重复测量模型的响应变量如下表所示。gydF4y2Ba
模型中的响应项gydF4y2Ba | 威尔金森符号gydF4y2Ba |
---|---|
ygydF4y2Ba1gydF4y2Ba | 日元gydF4y2Ba |
ygydF4y2Ba1gydF4y2Ba,gydF4y2BaygydF4y2Ba2gydF4y2Ba,gydF4y2BaygydF4y2Ba3.gydF4y2Ba | Y1,Y2,Y3gydF4y2Ba |
ygydF4y2Ba1gydF4y2Ba,gydF4y2BaygydF4y2Ba2gydF4y2Ba,gydF4y2BaygydF4y2Ba3.gydF4y2Ba,gydF4y2BaygydF4y2Ba4gydF4y2Ba,gydF4y2BaygydF4y2Ba5gydF4y2Ba | Y1-Y5.gydF4y2Ba |
例如,如果你有三个重复的措施作为反应和因素gydF4y2BaxgydF4y2Ba1gydF4y2Ba,gydF4y2BaxgydF4y2Ba2gydF4y2Ba, 和gydF4y2BaxgydF4y2Ba3.gydF4y2Ba作为预测变量,则可以使用Wilkinson表示法定义重复测量模型如下:gydF4y2Ba
Y1,Y2,Y3gydF4y2Ba~gydF4y2Bax1gydF4y2Ba+gydF4y2Bax2gydF4y2Ba+gydF4y2Bax3gydF4y2Ba
或者gydF4y2Ba
Y1-y3 ~ x1 + x2 + x3gydF4y2Ba
如果输入数据(响应和预测变量)存储在表或数据集数组中,则可以使用变量名指定公式。例如,加载gydF4y2BaCarsmall.gydF4y2Ba
示例数据。创建包含以下内容的表gydF4y2Ba重量gydF4y2Ba
,gydF4y2Ba加速gydF4y2Ba
, 和gydF4y2Ba英里/加仑gydF4y2Ba
.属性为每个变量命名gydF4y2Ba“VariableNames”gydF4y2Ba
拟合函数的名值对参数gydF4y2BafitlmgydF4y2Ba
.然后将以下模型适合数据:gydF4y2Ba
负载gydF4y2BaCarsmall.gydF4y2Ba台=表(重量、加速度、MPG,gydF4y2Ba...gydF4y2Ba“VariableNames”gydF4y2Ba,{gydF4y2Ba'重量'gydF4y2Ba,gydF4y2Ba“加速”gydF4y2Ba,gydF4y2Ba“英里”gydF4y2Ba});mdl = fitlm(资源描述,gydF4y2Ba'MPG〜重量+加速'gydF4y2Ba)gydF4y2Ba
mdl =线性回归模型:MPG ~ 1 + Weight +加速度估计系数:估计SE tStat pValue __________ __________ _______ __________ (Intercept) 45.155 3.4659 13.028 1.6266e-22 Weight -0.0082475 0.00059836 -13.783 5.3165e-24加速度0.19694 0.14743 1.3359 0.18493观测数:94,误差自由度:91均方根误差:4.12 R-squared: 0.743, Adjusted R-squared: 0.738 F-statistic vs. constant model: 132, p-value = 1.38e-27gydF4y2Ba
模型对象显示使用输入表中提供的变量名。gydF4y2Ba
如果将输入数据存储为矩阵,则可以使用默认变量名称指定公式,例如gydF4y2BaygydF4y2Ba
,gydF4y2Bax1gydF4y2Ba
, 和gydF4y2Bax2gydF4y2Ba
.例如,加载gydF4y2BaCarsmall.gydF4y2Ba
示例数据。创建一个包含预测变量的矩阵gydF4y2Ba重量gydF4y2Ba
和gydF4y2Ba加速gydF4y2Ba
.然后将以下模型适合数据:gydF4y2Ba
负载gydF4y2BaCarsmall.gydF4y2BaX =(重量、加速度);y = MPG;mdl = fitlm (X, y,gydF4y2Ba'y ~ x1 + x2'gydF4y2Ba)gydF4y2Ba
mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue __________ __________ _______ __________ (Intercept) 45.155 3.4659 13.028 1.6266e-22 x1 -0.0082475 0.00059836 -13.783 5.3165e-24 x2 0.19694 0.14743 1.3359 0.18493观测数:94,误差自由度:91均方根误差:4.12 r平方:0.743,调整后的r平方:0.738 f统计量与常数模型:132,p值= 1.38e-27gydF4y2Ba
术语gydF4y2Bax1gydF4y2Ba
模型规格公式中对应于预测变量矩阵的第一列gydF4y2BaXgydF4y2Ba
.术语gydF4y2Bax2gydF4y2Ba
对应于输入矩阵的第二列。术语gydF4y2BaygydF4y2Ba
对应于响应变量。gydF4y2Ba
用gydF4y2BafitlmgydF4y2Ba
和gydF4y2Ba步骤行程gydF4y2Ba
来拟合线性模型。gydF4y2Ba
对于具有截距和两个固定效果预测器的线性回归模型,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y ~ x1 + x2'gydF4y2Ba
对于没有截距和两个固定效果预测器的线性回归模型,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y ~ -1 + x1 + x2'gydF4y2Ba
对于一个有截距的线性回归模型,两个固定效应预测器和一个交互项,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
“y ~ x1 * x2”gydF4y2Ba
或者gydF4y2Ba
'y〜x1 + x2 + x1:x2'gydF4y2Ba
对于具有截距的线性回归模型,三个固定效果预测器和所有三个预测器之间的交互效应以及所有低阶项,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
“y ~ x1 * x2 * x3”gydF4y2Ba
对于一个有截距的线性回归模型,三个固定效应预测器,以及两个预测器之间的交互效应,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y ~ x1*x2 + x3'gydF4y2Ba
或者gydF4y2Ba
` y ~ x1 + x2 + x3 + x1:x2'gydF4y2Ba
对于具有截距的线性回归模型,有三个固定效应预测因子,以及三个预测因子之间的成对交互效应,但同时排除三个预测因子之间的交互效应,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
` y ~ x1*x2*x3 - x1:x2:x3 `gydF4y2Ba
用gydF4y2Bafitlme.gydF4y2Ba
和gydF4y2BafitlmematrixgydF4y2Ba
拟合线性混合效应模型。gydF4y2Ba
对于包含随机截距但没有预测项的线性混合效应模型,例如gydF4y2Ba
在哪里gydF4y2Ba
和gydF4y2BaggydF4y2Ba分组变量是否带有gydF4y2Ba米gydF4y2Ba,使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'Y〜(1 | g)'gydF4y2Ba
对于包含固定截距、随机截距和固定斜率的连续预测变量的线性混合效应模型,例如gydF4y2Ba
在哪里gydF4y2Ba
和gydF4y2BaggydF4y2Ba分组变量是否带有gydF4y2Ba米gydF4y2Ba,使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y ~ x1 + (1 | g)'gydF4y2Ba
对于一个线性混合效应模型,它包含一个固定截距,加上一个随机截距和一个随机斜率,它们之间可能存在相关性,比如gydF4y2Ba
在哪里gydF4y2Ba
和gydF4y2BaDgydF4y2Ba为2 × 2对称的正半定协方差矩阵,以方差分量向量θ作为参数,用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y〜x1 +(x1 | g)'gydF4y2Ba
随机效应协方差矩阵的形态由模型拟合函数决定。要指定协方差矩阵模式,请使用通过可用的名称-值对gydF4y2Bafitlme.gydF4y2Ba
当拟合模型时。例如,可以指定随机截距和随机斜率相互独立的假设gydF4y2Ba'covariancepattern'gydF4y2Ba
中名称-值对参数gydF4y2Bafitlme.gydF4y2Ba
.gydF4y2Ba
用gydF4y2BafitglmgydF4y2Ba
和gydF4y2BastepwiseglmgydF4y2Ba
拟合广义线性模型。gydF4y2Ba
在广义线性模型中,gydF4y2BaygydF4y2Ba响应变量具有除正常之外的分布,但您可以将模型表示为回归系数中线性的等式。指定广义的线性模型需要三个部分:gydF4y2Ba
分布响应变量gydF4y2Ba
链接功能gydF4y2Ba
线性预测gydF4y2Ba
响应变量的分布和链接功能使用拟合功能中的名称值对参数指定gydF4y2BafitglmgydF4y2Ba
或者gydF4y2BastepwiseglmgydF4y2Ba
.gydF4y2Ba
等式的线性预测器部分,它出现在右侧gydF4y2Ba~gydF4y2Ba
符号在模型规范公式中,以与线性模型示例相同的方式使用威尔金森符号。gydF4y2Ba
广义线性模型对连杆函数进行建模,而不是对实际响应进行建模gydF4y2BaygydF4y2Ba.这反映在模型对象的输出显示中。gydF4y2Ba
对于具有截距和两个预测器的广义线性回归模型,例如gydF4y2Ba
使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y ~ x1 + x2'gydF4y2Ba
用gydF4y2BaFitglme.gydF4y2Ba
拟合广义线性混合效应模型。gydF4y2Ba
在广义线性混合效应模型中gydF4y2BaygydF4y2Ba响应变量具有除正常之外的分布,但您可以将模型表示为回归系数中线性的等式。指定广义的线性模型需要三个部分:gydF4y2Ba
分布响应变量gydF4y2Ba
链接功能gydF4y2Ba
线性预测gydF4y2Ba
响应变量的分布和链接功能使用拟合功能中的名称值对参数指定gydF4y2BaFitglme.gydF4y2Ba
.gydF4y2Ba
等式的线性预测器部分,它出现在右侧gydF4y2Ba~gydF4y2Ba
符号在模型规范公式中,以与线性混合效应模型示例相同的方式使用威尔金森符号。gydF4y2Ba
广义线性模型将连杆函数模型为gydF4y2BaygydF4y2Ba而不是反应本身。这反映在模型对象的输出显示中。gydF4y2Ba
随机效应协方差矩阵的形态由模型拟合函数决定。要指定协方差矩阵模式,请使用通过可用的名称-值对gydF4y2BaFitglme.gydF4y2Ba
当拟合模型时。例如,可以指定随机截距和随机斜率相互独立的假设gydF4y2Ba'covariancepattern'gydF4y2Ba
中名称-值对参数gydF4y2BaFitglme.gydF4y2Ba
.gydF4y2Ba
对于包含固定截距,随机截距和固定斜率的广义线性混合效果模型,用于连续预测变量,可以使用泊松分布(例如)使用泊松分布进行建模响应gydF4y2Ba
在哪里gydF4y2Ba
和gydF4y2BaggydF4y2Ba分组变量是否带有gydF4y2Ba米gydF4y2Ba,使用Wilkinson表示法指定模型公式如下:gydF4y2Ba
'y ~ x1 + (1 | g)'gydF4y2Ba
用gydF4y2BaFitrm.gydF4y2Ba
适合重复措施模型。gydF4y2Ba
对于包含5个响应测量值和1个预测变量的重复测量模型,使用Wilkinson符号指定模型公式如下:gydF4y2Ba
“y1-y5 ~ x1”gydF4y2Ba
对于包含5个响应测量和3个预测变量的重复测量模型,加上两个预测变量之间的相互作用,使用Wilkinson符号指定模型公式如下:gydF4y2Ba
'y1-y5 ~ x1*x2 + x3'gydF4y2Ba
G. N.威尔金森和C. E.罗杰斯。gydF4y2Ba方差分析的因子模型的符号描述。gydF4y2Ba皇家统计学会22,392-399页,1973。gydF4y2Ba