文档

随机

类:GeneralizedLinearMixedModel

由拟合的广义线性混合效应模型生成随机响应

语法

Ysim =随机(glme)
Ysim = random(glme,tblnew)
随机的(___、名称、值)

描述

例子

ysim=随机(glme返回模拟响应,ysim,由拟合的广义线性混合效应模型得到glme,在原始设计点。

ysim=随机(glmetblnew使用表或数据集数组中指定的新输入值返回模拟响应,tblnew

ysim=随机(___名称,值使用一个或多个指定的附加选项返回模拟响应名称,值对参数,使用前面的任何语法。例如,您可以为模型指定观察权重、二项大小或偏移量。

输入参数

全部展开

广义线性混合效应模型,定义为GeneralizedLinearMixedModel对象。有关此对象的属性和方法,请参见GeneralizedLinearMixedModel

新的输入数据,其中包括响应变量、预测变量和分组变量,指定为表或数据集数组。预测变量可以是连续变量或分组变量。tblnew必须包含与原始表或数据集数组相同的变量,资源描述,用于拟合广义线性混合效应模型glme

数据类型:||逻辑|字符

名称-值对参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在单引号内(' ').您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

全部展开

二项分布的试验次数,指定为逗号分隔的对,由“BinomialSize”和一个-by-1向量的正整数值,其中行数是多少tblnew.的“BinomialSize”名称-值对只适用于二项分布。该值指定在生成随机响应值时进行二项试验的次数。

数据类型:|

模型偏移量,指定为长度标量值的向量,在那里行数是多少tblnew.偏移量用作一个附加的预测器,并有一个固定的系数值1

观察权重,由逗号分隔的对组成“重量”和一个非负标量值的-by-1向量,其中行数是多少tblnew.如果响应分布是二项分布或泊松分布,则“重量”必须是正整数组成的向量。

数据类型:|

输出参数

全部展开

模拟响应值,返回为-by-1向量,其中行数是多少tblnew随机创建ysim首先根据拟合先验分布生成随机效应向量。随机然后生成ysim根据随机效应的拟合条件分布。随机在拟合模型时考虑了观测权值的影响fitglme,如果有的话。

例子

全部展开

导航到包含示例数据的文件夹。加载样例数据。

cd (matlabroot) cd (“帮助/工具箱/统计/例子”)加载生产商

这些模拟数据来自一家制造公司,该公司在全球拥有50家工厂,每个工厂都运行批处理流程来生产成品。该公司希望减少每批产品的缺陷数量,因此开发了一种新的制造工艺。为了测试新工艺的有效性,该公司随机选择了20家工厂参与实验:10家工厂实施了新工艺,而另外10家继续运行旧工艺。在这20家工厂中,每一家工厂运行5批次(共100批次),并记录了以下数据:

  • 标志,以指示批处理是否使用了新过程(newprocess

  • 每批的处理时间(以小时为单位)(时间

  • 批处理的温度,以摄氏度为单位(临时

  • 指示供应商的类别变量(一个B,或C)说明批内所使用的化学品(供应商

  • 批内缺陷数量(缺陷

数据还包括time_dev而且temp_dev,分别表示时间和温度与20℃下3小时的工艺标准的绝对偏差。

拟合广义线性混合效应模型newprocesstime_devtemp_dev,供应商作为固定效应预测因子。包括一个随机效应术语的拦截分组工厂,以考虑由于工厂特定的差异而可能存在的质量差异。响应变量缺陷具有泊松分布,适合该模型的链接函数为log。用拉普拉斯拟合方法估计系数。指定虚拟变量编码为“影响”,所以虚变量系数之和为0。

缺陷的数量可以用泊松分布来建模

$$缺陷_{ij} \sim泊松(\mu _{ij})$$

这对应于广义线性混合效应模型

$log(\mu_{ij}) = \beta _0 + \beta_1 newprocess_{ij} + \beta_2 timeDev_{ij} + \beta_3 tempDev_{ij} + \beta_4 supplierC_{ij} + \beta_5 supplierB_{ij} + b_{i}$

在哪里

  • 美元defects_ {ij} $在工厂生产的批次中是否观察到缺陷数量我美元在批处理$ j $

  • $ \μ_ {ij} $平均缺陷数是否与工厂对应我美元($i = 1,2,…, 20美元)批处理期间$ j $($j = 1,2,…, 5美元).

  • 美元newprocess_ {ij} $美元timeDev_ {ij} $,美元tempDev_ {ij} $每个变量的测量是否与工厂对应我美元在批处理$ j $.例如,美元newprocess_ {ij} $是否由工厂生产的批次我美元在批处理$ j $使用新流程。

  • 美元supplierC_ {ij} $而且美元supplierB_ {ij} $是否使用效果(和到零)编码来指示公司的虚拟变量CB分别为工厂生产的批次提供了工艺化学品我美元在批处理$ j $

  • $b_{i} \sim N(0,(\sigma_{b})^{2})$每个工厂都有随机效果拦截吗我美元这就解释了不同工厂在质量上的差异。

Glme = fitglme(mfr,缺陷~ 1 + newprocess + time_dev + temp_dev +供应商+(1|工厂)'“分布”“泊松”“链接”“日志”“FitMethod”“拉普拉斯”“DummyVarCoding”“影响”);

使用随机从拟合模型中模拟一个新的响应向量。

rng (0,“旋风”);%用于再现性Ynew = random(glme);

显示模拟响应向量的前10行。

ynew (1:10)
Ans = 3 3 1 7 5 8 7 9 5 9

使用新的输入值模拟新的响应向量。的前10行创建一个新表生产商tblnew

Tblnew = mfr(1:10,:);

的前10行生产商包括从试验1到试验5收集的工厂1和工厂2的数据。两家工厂在试验中都使用了旧工艺,所以Newprocess = 0对于所有10个观察结果。

更改的值newprocess1对于在tblnew

tblnew。newprocess = ones(height(tblnew),1);

中的新输入值模拟新的响应tblnew

Ynew2 = random(glme,tblnew)
Ynew2 = 2 3 5 4 2 2 2 1 2 0

定义

全部展开

这个话题有用吗?