dummyvar

创建虚拟变量

描述

d= dummyvar(返回一个矩阵d含0和1的列是为虚拟变量分组变量。的每一列是单个分组的变量,具有指示类别等级值。的行代表所有变量的观测。

例子

全部收缩

创建分类数据指定颜色类型的一个列向量。

颜色= {'红色';'蓝色';'绿色';'红色';'绿色';'蓝色'};颜色=分类(颜色);

为每个颜色类型的虚拟变量。

d = dummyvar(颜色)
d =6×30 0 1 1 0 0 0 1 0 0 0 1 0 1 0 1 0 0

在列d对应于水平颜色。例如,第一列dummyvar对应于第一级,'蓝色'颜色

显示的类别级别颜色

类(颜色)
ANS =3X1单元阵列{ '蓝'} { '绿色'} { '红'}

创建一个矩阵的含有两个机器和三个运算上的方法的效果的数据。

机= [1 1 1 1 2 2 2 2]  - ;操作者= [1 2 3 1 2 3 1 2]';基= [机​​器操作员]
基团=8×21 1 1 2 1 3 1 1 2 2 2 3 2 1 2 2

创建数据的虚拟变量

d = dummyvar(组)
d =8×51 0 1 0 0 1 0 0 1 0 1 0 0 0 1 1 0 1 0 0 0 1 0 1 0 0 1 0 0 1 0 1 1 0 0 0 1 0 1 0

的前两列d分别表示机器1和机2的观察结果。其余的列代表了三大运营商的意见。

创建电话类型的单元阵列和区域码的数值向量。

手机= {'移动';“座机”;'移动';'移动';'移动';“座机”;“座机”};码= [802 802 603 603 802 603 802]';

由于区域码数据具有对应于整数两级(而不是802倍的水平1:802), 兑换代码到一个分类矢量。

newcodes =分类(代码);

合并电话newcodes分组变量入单元阵列

组= {电话,newcodes};

对于集团在创建虚拟变量

d = dummyvar(组)
d =7×41 0 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1 0 0 1 0 1 1 0 0 1 0 1

的前两列d对应的手机类型,以及最后两列对应区号。

输入参数

全部收缩

分组变量,指定为正整数向量或表示单可变内水平类别列向量,含有一种或多种的单元阵列分组变量或表示多个变量中的水平的正整数矩阵。

如果是一个明确的矢量,则所述基团和它们的顺序的输出相匹配类别功能应用。如果是数值向量,则dummyvar假设集团及其顺序1:最大(组)。在这方面,dummyvar对待数值从分组变量不同grp2idx。对于组内的分组变量顺序的信息,请参阅分组变量

例:[2 1 1 1 2 3 3 2]”

例:{来源,气缸}

数据类型:||明确的|细胞

输出参数

全部收缩

虚拟变量,返回一个ñ-通过-小号数字矩阵,其中ñ是的行数小号是级别的数量的在每一列的总和。从左至右,的列d来自的第一列创建虚拟变量,随后从所述第二列上创建虚拟变量, 等等。

数据类型:|

提示

  • 使用回归分析和方差虚拟变量来表示分类预测值。

  • dummyvar对待为NaN价值观和不确定的绝对水平为丢失数据并返回为NaN价值观d

  • 如果一的一列矩阵介绍d,然后将所得的矩阵X = [酮(尺寸(d,1),1)d]是秩亏。如果具有多列,则矩阵d本身是秩亏因为虚拟变量从任何塔中产生的始终总计为构成的列。回归和ANOVA计算通常通过从每个组虚拟变量的由一列产生的消除一个伪变量(丢弃列隐含设定的系数为零)解决这个问题

  • 如果是水平的数值向量不完全对应于整数1:最大(组)中,首先通过使用数据转换为分类矢量明确的。然后,您可以通过结果dummyvar。对于一个示例,请参见创建多个分组变量虚拟变量

扩展功能

R2006a前推出