主要内容

克罗斯塔布

交叉制表

描述

例子

TBL.= Crosstab(X1X2返回一个交叉表,TBL.,两个相同长度的载体,X1X2

例子

TBL.= Crosstab(x1,...,xn返回多维交叉表格,TBL.,多个输入向量的数据,X1X2,......,XN.

例子

[TBL.Chi2.P.] = Crosstab(___还返回Chi-Square统计,Chi2.,及其P.-价值,P.,用于测试TBL.每个维度都独立。您可以使用以前的任何语法。

例子

[TBL.Chi2.P.标签] = Crosstab(___还返回一个单元格数组,标签,其中包含每个输入参数的一列标签,X1......XN.

例子

全部收缩

创建两个样本数据向量,分别包含三个和四个不同的值。

x = [1 1 2 3 1];Y = [1 2 5 3 1];

交叉表格Xy

表= Crosstab(x,y)
表=3×4.2 1 0 0 0 0 0 0 1 0 0 1 0

行in.桌子对应于三个不同的值X,列对应于四个不同的值y

生成两个独立的向量,X1X2,每个包含在范围内的50个离散均匀随机数1:3

RNG.默认;重复性的%x1 = unidrnd(3,50,1);x2 = unidrnd(3,50,1);

交叉表格X1X2

[表,chi2,p] = crosstab(x1,x2)
表=3×31 6 7 5 5 2 11 7 6
Chi2 = 7.5449.
p = 0.1097.

回归P.的价值0.1097表示,在5%的意义水平下,克罗斯塔布未能拒绝零假设桌子每个维度都独立。

加载样品数据,其中包含1970-1982年内的大型车型的测量。

加载CARBIG.

交叉制表四缸汽车的数据(CYL4)基于模型年(什么时候)和原籍国(org.)。

[表,CHI2,P,标签] = Crosstab(Cyl4,何时,org);

标签确定索引位置桌子对于在数据后期在美国制造的四缸汽车数量。

标签
标签=3×3个单元阵列{'其他'} {'早期'} {'soper'} {'four'} {'four'} {'mid'} {'eurea'} {'eurea'} {0x0 double} {'lape'} {'dapan'} {'日本'}

第一列标签对应于数据CYL4,并表示该行2桌子包含有四个气缸的汽车数据。第二列标签对应于数据什么时候,并表示列3.桌子包含在晚期制作的汽车数据。第三列标签对应于数据org.,并表示位置1第三层桌子包含在美国制造的汽车数据。

所以,表(2,3,1)包含在晚期在美国制造的四缸汽车数量。

表(2,3,1)
ans = 38.

该数据在晚期在美国制造了38辆四缸汽车。

从数据创建竞争表,并在HeatMap图表中可视化表。

加载医院数据。

加载医院

医院DataSet阵列包含100名医院患者的数据,包括姓氏,性别,年龄,体重,吸烟状态和收缩性和舒张压测量。

将数据集数组转换为MATLAB®表。

tbl = dataset2table(医院);

通过创建一个2×2个竞争表的吸烟者和非闻名者,确定吸烟状态是否与性别无关。

[incttbl,chi2,p,标签] = crosstab(tbl.sex,tbl.smoker)
conttbl =.2×240 13 26 21
Chi2 = 4.5083
P = 0.0337.
标签=2x2细胞{'女'} {'0'} {'male'} {'1'}

由此产生的应急表的行Conttbl.对应于患者性别,第1行包含用于女性和第2行的数据,其中包含男性数据。该列对应于患者吸烟状态,其中第1列包含不用于吸烟者数据的非闻名者和第2列的数据。返回的结果Chi2 = 4.5083是Pearson的独立性考试的Chi平方测试统计的价值。这 P. - 用于测试的值P = 0.0337.建议,5%的意义程度,拒绝了性别和吸烟状态是独立的。

在Heatmap中可视化差管表。绘制吸烟状态 X - 轴和性别 y -轴。

热线图(TBL,“吸烟者”'性别'

图包含ActiveMap类型的对象。Type Heatmap图表具有性别与吸烟者的标题计数。

输入参数

全部收缩

输入向量,指定为分组变量的向量。所有输入向量,包括X1X2,......,XN.,必须是相同的长度。

数据类型:单身的|双倍的|char|细绳|逻辑|分类

输入向量,指定为分组变量的向量。所有输入向量,包括X1X2,......,XN.,必须是相同的长度。

数据类型:单身的|双倍的|char|细绳|逻辑|分类

输入向量,指定为分组变量的voors。如果使用此语法来指定两个以上的输入向量,那么克罗斯塔布生成多维交叉表格表。所有输入向量,包括X1X2,......,XN.,必须是相同的长度。

数据类型:单身的|双倍的|char|细绳|逻辑|分类

输出参数

全部收缩

跨表格表,作为整数值的矩阵返回。

如果指定两个输入向量,X1X2, 然后TBL.是一个m-经过-N矩阵,其中m是不同的值的数量X1N是不同的值的数量X2

如果指定三个或更多的输入向量,那么TBL(I,J,...,n)是一个指数的计数grp2idx(x1)一世grp2idx(x2)jgrp2idx(x3)K., 等等。

Chi-Square统计,作为正标量值返回。零假设是任何条目中的比例TBL.是每个维度中比例的产物。

Chi-Square测试统计的P值,返回范围内的标量值[0,1]克罗斯塔布测试TBL.每个维度都独立。

数据标签,返回为单元格数组。第一列中的条目是用于行的标签TBL.,第二列中的条目是列的标签,依此类推,用于多维TBL.

算法

  • 克罗斯塔布用途grp2idx.为每个不同的值分配正整数。TBL(I,J)是一个指数的计数grp2idx(x1)一世grp2idx(x2)j。数值顺序grp2idx(x1)grp2idx(x2)订单行和列TBL., 分别。

    在这种情况下,返回的值TBL(I,J,...,n)是一个指数的计数grp2idx(x1)一世grp2idx(x2)jgrp2idx(x3)K., 等等。

  • 克罗斯塔布计算P.- 使用渐近的配方对大样本大小有效的公式进行Chi-Square测试统计量。对于具有不均匀的边际分布的小样本或样品,近似值不太准确。如果您的示例仅包含两个变量,每个等级都有两个级别,则可以使用渔民反而。此功能执行Fisher的确切测试,不依赖于大样本分布假设。

扩展能力

也可以看看

|||

话题

在R2006A之前介绍