公式和设计矩阵之间的关系gydF4y2Ba
公式gydF4y2Ba
一般来说,一个模型规范公式是一个特征向量或字符串标量的形式gydF4y2Ba“y ~条款”gydF4y2Ba
。对于线性mixed-effects模型,这个公式的形式gydF4y2Ba“y ~固定+ (random1 | grouping1) +…+ (randomR | groupingR) 'gydF4y2Ba
,在那里gydF4y2Ba固定gydF4y2Ba
和gydF4y2Ba随机gydF4y2Ba
包含固定后果和随机项。gydF4y2Ba
假设一个表gydF4y2Ba资源描述gydF4y2Ba
包含以下:gydF4y2Ba
一个响应变量,gydF4y2Ba
ygydF4y2Ba
预测变量,gydF4y2Ba
XgydF4y2BajgydF4y2Ba
,可连续或分组变量gydF4y2Ba分组变量,gydF4y2Ba
ggydF4y2Ba1gydF4y2Ba
,gydF4y2BaggydF4y2Ba2gydF4y2Ba
、……gydF4y2BaggydF4y2BaRgydF4y2Ba
,gydF4y2Ba
分组变量在哪里gydF4y2BaXgydF4y2BajgydF4y2Ba
和gydF4y2BaggydF4y2BargydF4y2Ba
可以分类、逻辑、字符数组,字符串数组,或细胞阵列的特征向量。gydF4y2Ba
然后,在一个公式的形式,gydF4y2Ba“y ~固定+(随机的gydF4y2Ba1gydF4y2Ba| ggydF4y2Ba1gydF4y2Ba)+…+(随机gydF4y2BaRgydF4y2Ba| ggydF4y2BaRgydF4y2Ba)”gydF4y2Ba
,这个术语gydF4y2Ba固定gydF4y2Ba
对应于一个固定后果设计矩阵的规范gydF4y2BaXgydF4y2Ba
,gydF4y2Ba随机gydF4y2Ba
1gydF4y2Ba是一个随机设计矩阵的规范gydF4y2BaZgydF4y2Ba
1gydF4y2Ba相应的分组变量gydF4y2BaggydF4y2Ba
1gydF4y2Ba和类似的gydF4y2Ba随机gydF4y2Ba
RgydF4y2Ba是一个随机设计矩阵的规范gydF4y2BaZgydF4y2Ba
RgydF4y2Ba相应的分组变量gydF4y2BaggydF4y2Ba
RgydF4y2Ba。你可以表达gydF4y2Ba固定gydF4y2Ba
和gydF4y2Ba随机gydF4y2Ba
使用威尔金森符号。gydF4y2Ba
威尔金森符号描述的因素出现在模型中。符号与因素存在于模型,不是乘数(系数)的因素。gydF4y2Ba
威尔金森符号gydF4y2Ba | 因素标准符号gydF4y2Ba |
---|---|
1gydF4y2Ba |
常数(拦截)gydF4y2Ba |
X ^ kgydF4y2Ba ,在那里gydF4y2BakgydF4y2Ba 是一个正整数gydF4y2Ba |
XgydF4y2Ba ,gydF4y2BaXgydF4y2Ba2gydF4y2Ba 、……gydF4y2BaXgydF4y2BakgydF4y2Ba |
X1 + X2gydF4y2Ba |
X1gydF4y2Ba ,gydF4y2BaX2gydF4y2Ba |
X1 * X2gydF4y2Ba |
X1gydF4y2Ba ,gydF4y2BaX2gydF4y2Ba ,gydF4y2BaX1。* X2(elementwise multiplication of X1 and X2) |
X1, X2gydF4y2Ba |
X1。* X2gydF4y2Ba 只有gydF4y2Ba |
- - - - - - X2gydF4y2Ba |
不包括gydF4y2BaX2gydF4y2Ba |
X1 * X2 + X3gydF4y2Ba |
X1gydF4y2Ba ,gydF4y2BaX2gydF4y2Ba ,gydF4y2BaX3gydF4y2Ba ,gydF4y2BaX1 * X2gydF4y2Ba |
X1 + X2 + X3 + X1, X2gydF4y2Ba |
X1gydF4y2Ba ,gydF4y2BaX2gydF4y2Ba ,gydF4y2BaX3gydF4y2Ba ,gydF4y2BaX1 * X2gydF4y2Ba |
X1 * X2 * X3 - X1, X2, X3gydF4y2Ba |
X1gydF4y2Ba ,gydF4y2BaX2gydF4y2Ba ,gydF4y2BaX3gydF4y2Ba ,gydF4y2BaX1 * X2gydF4y2Ba ,gydF4y2BaX1 * X3gydF4y2Ba ,gydF4y2BaX2 * X3gydF4y2Ba |
X1 * (X2 + X3)gydF4y2Ba |
X1gydF4y2Ba ,gydF4y2BaX2gydF4y2Ba ,gydF4y2BaX3gydF4y2Ba ,gydF4y2BaX1 * X2gydF4y2Ba ,gydF4y2BaX1 * X3gydF4y2Ba |
统计和机器学习工具箱™符号总是包含一个常数项,除非你显式地删除术语使用gydF4y2Ba1gydF4y2Ba
。这里有一些例子为线性mixed-effects模型规范。gydF4y2Ba
例子:gydF4y2Ba
公式gydF4y2Ba | 描述gydF4y2Ba |
---|---|
“y ~ X1 + X2”gydF4y2Ba |
固定的拦截效果,gydF4y2BaX1gydF4y2Ba 和gydF4y2BaX2gydF4y2Ba 。这相当于gydF4y2Ba“y ~ 1 + X1 + X2”gydF4y2Ba 。gydF4y2Ba |
“y ~ 1 + X1 + X2”gydF4y2Ba |
没有拦截和固定效果gydF4y2BaX1gydF4y2Ba 和gydF4y2BaX2gydF4y2Ba 。包括隐式截距项是镇压gydF4y2Ba1gydF4y2Ba 。gydF4y2Ba |
“y ~ 1 + (1 | g1) 'gydF4y2Ba |
固定效应拦截的拦截+随机效应为每个级别的分组变量gydF4y2Bag1gydF4y2Ba 。gydF4y2Ba |
“y ~ X1 + (1 | g1) 'gydF4y2Ba |
随机拦截模型与一个固定的斜率。gydF4y2Ba |
“y ~ X1 + (X1 | g1) 'gydF4y2Ba |
随机截距和斜率,它们之间可能的相关性。这相当于gydF4y2Ba“y ~ 1 + X1 + (1 + X1 | g1) 'gydF4y2Ba 。gydF4y2Ba |
“y ~ X1 + (1 | g1) + (1 + X1 | g1) 'gydF4y2Ba |
独立随机效应方面截距和斜率。gydF4y2Ba |
“y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1, g2) 'gydF4y2Ba |
随机拦截模型与独立的主要影响gydF4y2Bag1gydF4y2Ba 和gydF4y2Bag2gydF4y2Ba ,再加上一个独立的相互影响。gydF4y2Ba |
为固定和随机效应设计矩阵gydF4y2Ba
fitlmegydF4y2Ba
在转换表达式gydF4y2Ba固定gydF4y2Ba
和gydF4y2Ba随机gydF4y2Ba
部分(不是分组变量)的公式设计矩阵如下:gydF4y2Ba
公式中的每个词将一个或多个列添加到相应的设计矩阵。gydF4y2Ba
一个词包含一个连续变量添加一列设计矩阵。gydF4y2Ba
一个包含一个分类变量固定期限gydF4y2Ba
XgydF4y2Ba
与gydF4y2BakgydF4y2Ba水平增加(gydF4y2BakgydF4y2Ba- 1)虚变量设计矩阵。gydF4y2Ba例如,如果变量gydF4y2Ba
供应商gydF4y2Ba
代表三个不同的供应商从制造商接收部分,即一个分类变量有三个水平,6批的部分,前两个批次来自供应商1(1级),第二个两批来自供应商2(要求等级2),最后两批来自供应商3(3级),等gydF4y2Ba供应商= 1 1 2 2 3 3gydF4y2Ba
供应商gydF4y2Ba
公式作为固定后果或随机项添加以下两个虚拟变量对应的设计矩阵,使用gydF4y2Ba“参考”gydF4y2Ba
对比:gydF4y2Ba0 0 0 0 1 0 1 0 0 1 0 1gydF4y2Ba
“DummyVarCoding”gydF4y2Ba
名称-值对的观点gydF4y2BafitlmegydF4y2Ba
。gydF4y2Ba如果gydF4y2Ba
X1gydF4y2Ba
和gydF4y2BaX2gydF4y2Ba
是连续变量,产品术语gydF4y2BaX1, X2gydF4y2Ba
增加了一列通过elementwise乘法gydF4y2BaX1gydF4y2Ba
和gydF4y2BaX2gydF4y2Ba
设计矩阵。gydF4y2Ba如果gydF4y2Ba
X1gydF4y2Ba
是连续的,gydF4y2BaX2gydF4y2Ba
分类与gydF4y2BakgydF4y2Ba水平,产品项gydF4y2BaX1, X2gydF4y2Ba
繁殖elementwisegydF4y2BaX1gydF4y2Ba
与(gydF4y2BakgydF4y2Ba- 1)虚拟变量表示gydF4y2BaX2gydF4y2Ba
和添加这些(gydF4y2BakgydF4y2Ba- 1)设计矩阵列。gydF4y2Ba例如,如果gydF4y2Ba
药物gydF4y2Ba
是药物给病人的数量,一个持续的治疗,然后呢gydF4y2Ba时间gydF4y2Ba
是三个不同的时间点当卫生措施三个层次的分类变量,九个观察,前三个是观察到时间点1,第二三个观察时间点2,最后三个观察时间点3,这样gydF4y2Ba(药物时间)= 0.1000 1.0000 0.2000 1.0000 0.5000 2.0000 0.6000 2.0000 0.3000 3.0000 0.8000 3.0000gydF4y2Ba
药物:时间gydF4y2Ba
将下面的两个变量添加到设计矩阵:gydF4y2Ba0 0 0 0 0 0 0 0 0.3000 0.8000 0.6000 0.5000gydF4y2Ba
如果gydF4y2Ba
X1gydF4y2Ba
和gydF4y2BaX2gydF4y2Ba
是分类变量,gydF4y2BakgydF4y2Ba和gydF4y2Ba米gydF4y2Ba水平分别产品项gydF4y2BaX1, X2gydF4y2Ba
(补充道gydF4y2BakgydF4y2Ba- 1)* (gydF4y2Ba米gydF4y2Ba- 1)虚拟变量的设计矩阵由elementwise每一哑变量代表的产物gydF4y2BaX1gydF4y2Ba
每个哑变量表示gydF4y2BaX2gydF4y2Ba
。gydF4y2Ba例如,在一个实验来确定类型的玉米和出现的影响方法产量,假设有三种类型的gydF4y2Ba
玉米gydF4y2Ba
和两种类型的gydF4y2Ba方法gydF4y2Ba
如下:gydF4y2Ba1油油1空气空气油2 2 2空气3油3 3 3空气gydF4y2Ba
玉米:方法gydF4y2Ba
增加了以下设计矩阵:gydF4y2Ba0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0gydF4y2Ba
这个词gydF4y2Ba
X1 * X2gydF4y2Ba
添加必要的列数gydF4y2BaX1gydF4y2Ba
,gydF4y2BaX2gydF4y2Ba
,gydF4y2BaX1, X2gydF4y2Ba
设计矩阵。gydF4y2Ba这个词gydF4y2Ba
X1 ^ 2gydF4y2Ba
添加必要的列数gydF4y2BaX1gydF4y2Ba
和gydF4y2BaX1: X1gydF4y2Ba
设计矩阵。gydF4y2Ba符号gydF4y2Ba
1gydF4y2Ba
(一)公式代表所有1 s的列。默认情况下一列中包含1 s的设计矩阵。排除的设计矩阵的一列,您必须显式地指定gydF4y2Ba1gydF4y2Ba
作为一个术语表达。gydF4y2Ba
分组变量gydF4y2Ba
fitlmegydF4y2Ba
处理的分组变量gydF4y2Ba(. |集团)gydF4y2Ba
的一部分公式如下:gydF4y2Ba
如果一个分组变量gydF4y2BakgydF4y2Ba水平,然后gydF4y2BakgydF4y2Ba虚变量代表该分组。gydF4y2Ba
例如,假设gydF4y2Ba
区gydF4y2Ba
是一个分类分组变量有三个水平,显示了三种类型的地区六所学校,前两个是在区域1中,后两个区2,最后两个是在3区,所以呢gydF4y2Ba区= 1 1 2 2 3 3gydF4y2Ba
1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1gydF4y2Ba
如果gydF4y2Ba
X1gydF4y2Ba
是一个连续随机变量和gydF4y2BaX2gydF4y2Ba
是一个分组变量gydF4y2BakgydF4y2Ba水平,然后随机项gydF4y2Ba(X1 - 1 | X2)gydF4y2Ba
繁殖elementwisegydF4y2BaX1gydF4y2Ba
与gydF4y2BakgydF4y2Ba虚变量代表gydF4y2BaX2gydF4y2Ba
并添加这些gydF4y2BakgydF4y2Ba列随机设计矩阵。gydF4y2Ba例如,假设gydF4y2Ba
分数gydF4y2Ba
是一个连续变量显示学生的数学考试成绩的学校,然后呢gydF4y2Ba类gydF4y2Ba
是一个分类变量和三个水平,显示了三种不同的类学校。也,假设的九个观测前三个对应于第一节课学生的分数,第二三个对应分数的学生第二课堂,最后三个对应学生的分数在第三类,如gydF4y2Ba(分数类)= 78.0000 1.0000 68.0000 1.0000 81.0000 2.0000 53.0000 2.0000 85.0000 3.0000 72.0000 3.0000gydF4y2Ba
(得分- 1 |类)gydF4y2Ba
将以下三个列添加到随机设计矩阵:gydF4y2Ba81.0000 68.0000 78.0000 0 0 0 0 0 0 0 0 0 0 0 0 72.0000 85.0000 53.0000gydF4y2Ba
如果gydF4y2Ba
X1gydF4y2Ba
是一个连续预测变量和gydF4y2BaX2gydF4y2Ba
和gydF4y2BaX3gydF4y2Ba
是分组变量和gydF4y2BakgydF4y2Ba和gydF4y2Ba米gydF4y2Ba水平分别,这个词gydF4y2Ba(X1 | X2: X3)gydF4y2Ba
代表这个分组gydF4y2BaX1gydF4y2Ba
与gydF4y2BakgydF4y2Ba*gydF4y2Ba米gydF4y2Ba虚变量由elementwise每一哑变量代表的产物gydF4y2BaX2gydF4y2Ba
每个哑变量表示gydF4y2BaX3gydF4y2Ba
。gydF4y2Ba例如,假设gydF4y2Ba
治疗gydF4y2Ba
是一个连续的预测变量,有三个级别的gydF4y2Ba块gydF4y2Ba
和两个级别的gydF4y2Ba情节gydF4y2Ba
内嵌套块如下:gydF4y2Ba1 0.2000 0.1000 0.3000 0.5000 - 2 a 0.6000 - 2 3 3 b 0.8000gydF4y2Ba
然后,随机项gydF4y2Ba
(治疗- 1 |块:情节)gydF4y2Ba
增加以下随机设计矩阵:gydF4y2Ba0.1000 0 0 0 0 0 0 0 0 0 0 0 0 0.5000 0.2000 0.6000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.8000 0.3000gydF4y2Ba
另请参阅gydF4y2Ba
LinearMixedModelgydF4y2Ba
| gydF4y2BafitlmegydF4y2Ba
| gydF4y2BafitlmematrixgydF4y2Ba