主要内容

dummyvar

创建虚拟变量

描述

例子

D= dummyvar (集团)返回一个矩阵D包含0和1的列是为虚拟变量分组变量集团。每一列的集团是一个单独的分组变量,指示值类别的水平。的行集团代表观察各个变量。

例子

全部折叠

创建一个指定颜色分类数据类型的列向量。

颜色= {“红色”;“蓝”;“绿色”;“红色”;“绿色”;“蓝”};颜色=分类(颜色);

为每种颜色类型创建虚拟变量。

D = dummyvar(颜色)
D =6×30 0 1 1 0 0 0 1 0 0 0 1 0 1 0 1 0 0

列在D对应的水平颜色。例如,第一列dummyvar对应于第一级,“蓝”,在颜色

显示类别的水平颜色

类别(颜色)
ans =3 x1细胞{“蓝”}{“绿色”}{'红色'}

创建一个矩阵集团数据包含两台机器的影响和三个运营商的一个过程。

机= [1 1 1 1 2 2 2 2]”;运算符= (1 2 3 1 2 3 1 2)';组=(机器操作员)
组=8×21 1 1 2 3 1 1 2 2 2 3 2 1 2 2

创建虚拟变量的数据集团

D = dummyvar(集团)
D =8×51 0 1 0 0 1 0 0 1 0 1 0 0 0 1 1 0 1 0 0 0 1 0 1 0 0 1 0 0 1 0 1 1 0 0 0 1 0 1 0

的前两列D分别代表观察机器1和机器2。其余列表示观测的三个运营商。

创建一个单元阵列的区号的电话类型和数值向量。

电话= {“移动”;“固定电话”;“移动”;“移动”;“移动”;“固定电话”;“固定电话”};代码= (802 802 603 603 802 603 802)';

因为该地区代码数据有两个水平(而不是802年的水平对应的整数1:802),将代码一个分类向量。

newcodes =分类(编码);

结合电话newcodes分组变量单元阵列集团

组={电话,newcodes};

创建虚拟变量组集团

D = dummyvar(集团)
D =7×41 0 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1 0 0 1 0 1 1 0 0 1 0 1

的前两列D的手机类型相对应,最后两列对应于该地区代码。

输入参数

全部折叠

分组变量指定为一个正整数向量或分类列向量代表水平在一个变量,一个包含一个或多个单元阵列分组变量或者一个正整数矩阵在多个变量代表的水平。

如果集团是一个分类向量,那么团体和他们的订单匹配的输出类别函数应用到集团。如果集团是一个数值向量,然后呢dummyvar假设团体和他们的订单1:马克斯(集团)。在这方面,dummyvar不同于对待数字分组变量grp2idx。信息的组内分组变量,明白了分组变量

例子:[2 1 1 1 2 3 3 2]”

例子:{起源、汽缸}

数据类型:||分类|细胞

输出参数

全部折叠

虚拟变量,作为一个返回n——- - - - - -年代数字矩阵,n的行数集团年代是水平的数量每一列的总和集团。从左到右的列D从第一列的虚变量创建集团,其次是虚变量从第二列创建的集团,等等。

数据类型:|

提示

  • 使用虚拟变量回归分析和方差分析表明分类预测的值。

  • dummyvar对待价值观和未定义的分类水平集团缺失的数据,并返回D

  • 介绍了如果一个列的矩阵D,那么由此产生的矩阵X =[(大小(D, 1), 1) D]排名是有缺陷的。如果集团有多个列,那么矩阵D本身是等级不足,因为虚变量产生的任何列集团总是和一个列的。回归和方差分析的计算通常解决这个问题通过消除一个哑变量(隐式地设置列降至零的系数)每组的虚拟变量由一列集团

  • 如果集团是一个数值向量与水平不完全对应的整数1:马克斯(集团),首先将数据转换为一个分类向量通过使用分类。然后您可以通过结果dummyvar。例如,看到的创建虚拟变量从多个分组变量

扩展功能

之前介绍过的R2006a