加载示例数据。
这个模拟的数据从一个制造公司,经营世界各地50个工厂,每个工厂运行一个批处理创建一个成品。公司想要减少缺陷的数量在每一批,所以发明了一种新的制造过程。为了测试新流程的有效性,公司随机选择20的工厂参加一个实验:十个工厂实施新的流程,而其他十继续运行旧的流程。在每个20家工厂,公司跑五个批次(100批次),记录以下数据:
标志表明这批是否使用新工艺(newprocess
)
每一批处理时间,小时(时间
)
批处理的温度在摄氏度(临时
)
分类变量指示供应商(一个
,B
,或C
)的化学用于批处理(供应商
)
批处理的缺陷数量(缺陷
)
数据还包括time_dev
和temp_dev
代表时间的绝对偏差和温度,分别从流程标准的3小时20摄氏度。
适合一个广义线性mixed-effects模型使用newprocess
,time_dev
,temp_dev
,供应商
固定后果预测。包括一个随机拦截分组的工厂
,考虑到质量差异,可能存在由于factory-specific变化。响应变量缺陷
泊松分布,适当的日志链接函数模型。使用拉普拉斯合适方法来估计系数。指定哑变量编码“影响”
,所以哑变量系数之和为0。
缺陷的数量可以使用泊松分布建模
这对应于广义线性mixed-effects模型
在哪里
是缺陷的数量在批量生产的工厂吗
在批处理
。
缺陷对应的平均数量是工厂吗
(
在批处理)
(
)。
,
,
每个变量的测量是对应于工厂吗
在批处理
。例如,
指示是否批量生产的工厂
在批处理
使用新工艺。
和
虚拟变量,使用效果(总和为零)编码来表示是否公司吗C
或B
分别提供工厂生产的批处理过程的化学物质
在批处理
。
是一个随机拦截每个工厂吗
占factory-specific质量的变化。
计算和显示之前的估计协方差参数的随机预测。
psi {1}
之前估计的协方差矩阵的第一个分组变量。在这个例子中,只有一个分组变量(工厂
),所以psi {1}
是一个估计的
。
显示色散参数。
显示随机效应的估计标准偏差与预测有关。第一个单元格的统计数据
包含统计数据工厂
分散的,而第二个单元格包含统计数据参数。
ans =协方差类型:各向同性集团Name1 Name2类型工厂{(拦截)的}{(拦截)的}{“性病”}上0.31381 0.19253 0.51148估计低
随机效应的估计标准偏差与预测是0.31381。95%置信区间是(0.19253,0.51148)。因为置信区间不包含0,随机拦截在5%的显著性水平具有重要意义。