主要内容gydF4y2Ba

公式和设计矩阵之间的关系gydF4y2Ba

公式gydF4y2Ba

一般来说,一个模型规范公式是一个特征向量或字符串标量的形式gydF4y2Ba“y ~条款”gydF4y2Ba。对于线性mixed-effects模型,这个公式的形式gydF4y2Ba“y ~固定+ (random1 | grouping1) +…+ (randomR | groupingR) 'gydF4y2Ba,在那里gydF4y2Ba固定gydF4y2Ba和gydF4y2Ba随机gydF4y2Ba包含固定后果和随机项。gydF4y2Ba

假设一个表gydF4y2Ba资源描述gydF4y2Ba包含以下:gydF4y2Ba

  • 一个响应变量,gydF4y2BaygydF4y2Ba

  • 预测变量,gydF4y2BaXgydF4y2BajgydF4y2Ba,可连续或分组变量gydF4y2Ba

  • 分组变量,gydF4y2BaggydF4y2Ba1gydF4y2Ba,gydF4y2BaggydF4y2Ba2gydF4y2Ba、……gydF4y2BaggydF4y2BaRgydF4y2Ba,gydF4y2Ba

分组变量在哪里gydF4y2BaXgydF4y2BajgydF4y2Ba和gydF4y2BaggydF4y2BargydF4y2Ba可以分类、逻辑、字符数组,字符串数组,或细胞阵列的特征向量。gydF4y2Ba

然后,在一个公式的形式,gydF4y2Ba“y ~固定+(随机的gydF4y2Ba1gydF4y2Ba| ggydF4y2Ba1gydF4y2Ba)+…+(随机gydF4y2BaRgydF4y2Ba| ggydF4y2BaRgydF4y2Ba)”gydF4y2Ba,这个术语gydF4y2Ba固定gydF4y2Ba对应于一个固定后果设计矩阵的规范gydF4y2BaXgydF4y2Ba,gydF4y2Ba随机gydF4y2Ba1gydF4y2Ba是一个随机设计矩阵的规范gydF4y2BaZgydF4y2Ba1gydF4y2Ba相应的分组变量gydF4y2BaggydF4y2Ba1gydF4y2Ba和类似的gydF4y2Ba随机gydF4y2BaRgydF4y2Ba是一个随机设计矩阵的规范gydF4y2BaZgydF4y2BaRgydF4y2Ba相应的分组变量gydF4y2BaggydF4y2BaRgydF4y2Ba。你可以表达gydF4y2Ba固定gydF4y2Ba和gydF4y2Ba随机gydF4y2Ba使用威尔金森符号。gydF4y2Ba

威尔金森符号描述的因素出现在模型中。符号与因素存在于模型,不是乘数(系数)的因素。gydF4y2Ba

威尔金森符号gydF4y2Ba 因素标准符号gydF4y2Ba
1gydF4y2Ba 常数(拦截)gydF4y2Ba
X ^ kgydF4y2Ba,在那里gydF4y2BakgydF4y2Ba是一个正整数gydF4y2Ba XgydF4y2Ba,gydF4y2BaXgydF4y2Ba2gydF4y2Ba、……gydF4y2BaXgydF4y2BakgydF4y2Ba
X1 + X2gydF4y2Ba X1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba
X1 * X2gydF4y2Ba X1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba,gydF4y2BaX1。* X2(elementwise multiplication of X1 and X2)
X1, X2gydF4y2Ba X1。* X2gydF4y2Ba只有gydF4y2Ba
- - - - - - X2gydF4y2Ba 不包括gydF4y2BaX2gydF4y2Ba
X1 * X2 + X3gydF4y2Ba X1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba,gydF4y2BaX3gydF4y2Ba,gydF4y2BaX1 * X2gydF4y2Ba
X1 + X2 + X3 + X1, X2gydF4y2Ba X1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba,gydF4y2BaX3gydF4y2Ba,gydF4y2BaX1 * X2gydF4y2Ba
X1 * X2 * X3 - X1, X2, X3gydF4y2Ba X1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba,gydF4y2BaX3gydF4y2Ba,gydF4y2BaX1 * X2gydF4y2Ba,gydF4y2BaX1 * X3gydF4y2Ba,gydF4y2BaX2 * X3gydF4y2Ba
X1 * (X2 + X3)gydF4y2Ba X1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba,gydF4y2BaX3gydF4y2Ba,gydF4y2BaX1 * X2gydF4y2Ba,gydF4y2BaX1 * X3gydF4y2Ba

统计和机器学习工具箱™符号总是包含一个常数项,除非你显式地删除术语使用gydF4y2Ba1gydF4y2Ba。这里有一些例子为线性mixed-effects模型规范。gydF4y2Ba

例子:gydF4y2Ba

公式gydF4y2Ba 描述gydF4y2Ba
“y ~ X1 + X2”gydF4y2Ba 固定的拦截效果,gydF4y2BaX1gydF4y2Ba和gydF4y2BaX2gydF4y2Ba。这相当于gydF4y2Ba“y ~ 1 + X1 + X2”gydF4y2Ba。gydF4y2Ba
“y ~ 1 + X1 + X2”gydF4y2Ba 没有拦截和固定效果gydF4y2BaX1gydF4y2Ba和gydF4y2BaX2gydF4y2Ba。包括隐式截距项是镇压gydF4y2Ba1gydF4y2Ba。gydF4y2Ba
“y ~ 1 + (1 | g1) 'gydF4y2Ba 固定效应拦截的拦截+随机效应为每个级别的分组变量gydF4y2Bag1gydF4y2Ba。gydF4y2Ba
“y ~ X1 + (1 | g1) 'gydF4y2Ba 随机拦截模型与一个固定的斜率。gydF4y2Ba
“y ~ X1 + (X1 | g1) 'gydF4y2Ba 随机截距和斜率,它们之间可能的相关性。这相当于gydF4y2Ba“y ~ 1 + X1 + (1 + X1 | g1) 'gydF4y2Ba。gydF4y2Ba
“y ~ X1 + (1 | g1) + (1 + X1 | g1) 'gydF4y2Ba 独立随机效应方面截距和斜率。gydF4y2Ba
“y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1, g2) 'gydF4y2Ba 随机拦截模型与独立的主要影响gydF4y2Bag1gydF4y2Ba和gydF4y2Bag2gydF4y2Ba,再加上一个独立的相互影响。gydF4y2Ba

为固定和随机效应设计矩阵gydF4y2Ba

fitlmegydF4y2Ba在转换表达式gydF4y2Ba固定gydF4y2Ba和gydF4y2Ba随机gydF4y2Ba部分(不是分组变量)的公式设计矩阵如下:gydF4y2Ba

  • 公式中的每个词将一个或多个列添加到相应的设计矩阵。gydF4y2Ba

  • 一个词包含一个连续变量添加一列设计矩阵。gydF4y2Ba

  • 一个包含一个分类变量固定期限gydF4y2BaXgydF4y2Ba与gydF4y2BakgydF4y2Ba水平增加(gydF4y2BakgydF4y2Ba- 1)虚变量设计矩阵。gydF4y2Ba

    例如,如果变量gydF4y2Ba供应商gydF4y2Ba代表三个不同的供应商从制造商接收部分,即一个分类变量有三个水平,6批的部分,前两个批次来自供应商1(1级),第二个两批来自供应商2(要求等级2),最后两批来自供应商3(3级),等gydF4y2Ba

    供应商= 1 1 2 2 3 3gydF4y2Ba
    然后,添加gydF4y2Ba供应商gydF4y2Ba公式作为固定后果或随机项添加以下两个虚拟变量对应的设计矩阵,使用gydF4y2Ba“参考”gydF4y2Ba对比:gydF4y2Ba
    0 0 0 0 1 0 1 0 0 1 0 1gydF4y2Ba
    虚拟变量的更多细节,请参阅gydF4y2Ba虚拟变量gydF4y2Ba。其他对比选项,请参阅gydF4y2Ba“DummyVarCoding”gydF4y2Ba名称-值对的观点gydF4y2BafitlmegydF4y2Ba。gydF4y2Ba

  • 如果gydF4y2BaX1gydF4y2Ba和gydF4y2BaX2gydF4y2Ba是连续变量,产品术语gydF4y2BaX1, X2gydF4y2Ba增加了一列通过elementwise乘法gydF4y2BaX1gydF4y2Ba和gydF4y2BaX2gydF4y2Ba设计矩阵。gydF4y2Ba

  • 如果gydF4y2BaX1gydF4y2Ba是连续的,gydF4y2BaX2gydF4y2Ba分类与gydF4y2BakgydF4y2Ba水平,产品项gydF4y2BaX1, X2gydF4y2Ba繁殖elementwisegydF4y2BaX1gydF4y2Ba与(gydF4y2BakgydF4y2Ba- 1)虚拟变量表示gydF4y2BaX2gydF4y2Ba和添加这些(gydF4y2BakgydF4y2Ba- 1)设计矩阵列。gydF4y2Ba

    例如,如果gydF4y2Ba药物gydF4y2Ba是药物给病人的数量,一个持续的治疗,然后呢gydF4y2Ba时间gydF4y2Ba是三个不同的时间点当卫生措施三个层次的分类变量,九个观察,前三个是观察到时间点1,第二三个观察时间点2,最后三个观察时间点3,这样gydF4y2Ba

    (药物时间)= 0.1000 1.0000 0.2000 1.0000 0.5000 2.0000 0.6000 2.0000 0.3000 3.0000 0.8000 3.0000gydF4y2Ba
    然后,产品项gydF4y2Ba药物:时间gydF4y2Ba将下面的两个变量添加到设计矩阵:gydF4y2Ba

    0 0 0 0 0 0 0 0 0.3000 0.8000 0.6000 0.5000gydF4y2Ba
  • 如果gydF4y2BaX1gydF4y2Ba和gydF4y2BaX2gydF4y2Ba是分类变量,gydF4y2BakgydF4y2Ba和gydF4y2Ba米gydF4y2Ba水平分别产品项gydF4y2BaX1, X2gydF4y2Ba(补充道gydF4y2BakgydF4y2Ba- 1)* (gydF4y2Ba米gydF4y2Ba- 1)虚拟变量的设计矩阵由elementwise每一哑变量代表的产物gydF4y2BaX1gydF4y2Ba每个哑变量表示gydF4y2BaX2gydF4y2Ba。gydF4y2Ba

    例如,在一个实验来确定类型的玉米和出现的影响方法产量,假设有三种类型的gydF4y2Ba玉米gydF4y2Ba和两种类型的gydF4y2Ba方法gydF4y2Ba如下:gydF4y2Ba

    1油油1空气空气油2 2 2空气3油3 3 3空气gydF4y2Ba
    然后,交互项gydF4y2Ba玉米:方法gydF4y2Ba增加了以下设计矩阵:gydF4y2Ba

    0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0gydF4y2Ba
  • 这个词gydF4y2BaX1 * X2gydF4y2Ba添加必要的列数gydF4y2BaX1gydF4y2Ba,gydF4y2BaX2gydF4y2Ba,gydF4y2BaX1, X2gydF4y2Ba设计矩阵。gydF4y2Ba

  • 这个词gydF4y2BaX1 ^ 2gydF4y2Ba添加必要的列数gydF4y2BaX1gydF4y2Ba和gydF4y2BaX1: X1gydF4y2Ba设计矩阵。gydF4y2Ba

  • 符号gydF4y2Ba1gydF4y2Ba(一)公式代表所有1 s的列。默认情况下一列中包含1 s的设计矩阵。排除的设计矩阵的一列,您必须显式地指定gydF4y2Ba1gydF4y2Ba作为一个术语表达。gydF4y2Ba

分组变量gydF4y2Ba

fitlmegydF4y2Ba处理的分组变量gydF4y2Ba(. |集团)gydF4y2Ba的一部分公式如下:gydF4y2Ba

  • 如果一个分组变量gydF4y2BakgydF4y2Ba水平,然后gydF4y2BakgydF4y2Ba虚变量代表该分组。gydF4y2Ba

    例如,假设gydF4y2Ba区gydF4y2Ba是一个分类分组变量有三个水平,显示了三种类型的地区六所学校,前两个是在区域1中,后两个区2,最后两个是在3区,所以呢gydF4y2Ba

    区= 1 1 2 2 3 3gydF4y2Ba
    然后,代表该分组的虚变量有:gydF4y2Ba
    1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1gydF4y2Ba

  • 如果gydF4y2BaX1gydF4y2Ba是一个连续随机变量和gydF4y2BaX2gydF4y2Ba是一个分组变量gydF4y2BakgydF4y2Ba水平,然后随机项gydF4y2Ba(X1 - 1 | X2)gydF4y2Ba繁殖elementwisegydF4y2BaX1gydF4y2Ba与gydF4y2BakgydF4y2Ba虚变量代表gydF4y2BaX2gydF4y2Ba并添加这些gydF4y2BakgydF4y2Ba列随机设计矩阵。gydF4y2Ba

    例如,假设gydF4y2Ba分数gydF4y2Ba是一个连续变量显示学生的数学考试成绩的学校,然后呢gydF4y2Ba类gydF4y2Ba是一个分类变量和三个水平,显示了三种不同的类学校。也,假设的九个观测前三个对应于第一节课学生的分数,第二三个对应分数的学生第二课堂,最后三个对应学生的分数在第三类,如gydF4y2Ba

    (分数类)= 78.0000 1.0000 68.0000 1.0000 81.0000 2.0000 53.0000 2.0000 85.0000 3.0000 72.0000 3.0000gydF4y2Ba
    然后,随机项gydF4y2Ba(得分- 1 |类)gydF4y2Ba将以下三个列添加到随机设计矩阵:gydF4y2Ba

    81.0000 68.0000 78.0000 0 0 0 0 0 0 0 0 0 0 0 0 72.0000 85.0000 53.0000gydF4y2Ba
  • 如果gydF4y2BaX1gydF4y2Ba是一个连续预测变量和gydF4y2BaX2gydF4y2Ba和gydF4y2BaX3gydF4y2Ba是分组变量和gydF4y2BakgydF4y2Ba和gydF4y2Ba米gydF4y2Ba水平分别,这个词gydF4y2Ba(X1 | X2: X3)gydF4y2Ba代表这个分组gydF4y2BaX1gydF4y2Ba与gydF4y2BakgydF4y2Ba*gydF4y2Ba米gydF4y2Ba虚变量由elementwise每一哑变量代表的产物gydF4y2BaX2gydF4y2Ba每个哑变量表示gydF4y2BaX3gydF4y2Ba。gydF4y2Ba

    例如,假设gydF4y2Ba治疗gydF4y2Ba是一个连续的预测变量,有三个级别的gydF4y2Ba块gydF4y2Ba和两个级别的gydF4y2Ba情节gydF4y2Ba内嵌套块如下:gydF4y2Ba

    1 0.2000 0.1000 0.3000 0.5000 - 2 a 0.6000 - 2 3 3 b 0.8000gydF4y2Ba

    然后,随机项gydF4y2Ba(治疗- 1 |块:情节)gydF4y2Ba增加以下随机设计矩阵:gydF4y2Ba

    0.1000 0 0 0 0 0 0 0 0 0 0 0 0 0.5000 0.2000 0.6000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.8000 0.3000gydF4y2Ba

另请参阅gydF4y2Ba

| gydF4y2Ba| gydF4y2Ba

相关的话题gydF4y2Ba