主要内容

findgroups.

查找组并返回组号

描述

例子

G= findgroups (一种回报G,由分组变量创建的组号向量一种.输出参数G包含1到的整数值N,表明N不同的群体N独特的价值观一种.例如,如果一种{'b','a','a','b'}, 然后findgroups.回报G作为[2 1 1 2].您可以使用G将数据组分成其他变量。采用G的输入参数splitapplySplit-Apply-Combine工作流

findgroups.对待空的字符向量和,和未定义的分类值一种作为缺失的值并返回作为对应的元素G

例子

G= findgroups(a1,...,a)创建组号码A1,......,一个.这findgroups.函数将组定义为跨越值的唯一组合A1,......,一个.例如,如果A1{' a ', ' a ', ' b ', ' b '}A2[0 1 0 0], 然后findgroups (A1, A2)回报G作为[1 2 3 3],因为组合'b'0发生两次。

例子

[GID] = findgroups(一种中每个组的唯一值ID.例如,如果一种{'b','a','a','b'}, 然后findgroups.回报G作为[2 1 1 2]ID作为{'a','b'}.的参数一种ID是相同的数据类型,但不必是相同的大小。

例子

[G,ID1,...,Idn] = findgroups(a1,...,a)还返回每个组的唯一值ID1、…,印度尼西亚.的值在ID1、…,印度尼西亚定义组。例如,如果A1{' a ', ' a ', ' b ', ' b '}A2[0 1 0 0], 然后findgroups (A1, A2)回报G作为[1 2 3 3],ID1ID2下作为{' a ', ' a ', ' b '}(0 1 0)

例子

G= findgroups (T.回报G,由表中的变量创建的组号向量T..这findgroups.函数处理所有变量T.作为分组变量。

例子

[Gt] = findgroups(T.同样的回报t,包含每个组的唯一值的表。t的变量之间的值的唯一组合T..中的变量T.t具有相同的名称,但表不必具有相同的行数。

例子

全部收缩

使用组编号将患者高度测量分成性别分组。然后计算每个组的平均高度。

从数据文件中载入病人的身高和性别患者

加载病人谁是性别高度
名称大小字节类属性性别100x1 11412细胞高度100x1 800双

通过性别指定组findgroups.

g = findgroups(性别);

比较的前五个元素性别G.在哪里性别包含'女性'G包含1.在哪里性别包含'男性'G包含2

性别(1:5)
ans =.5 x1细胞{“男性”}{‘男性’}{‘女性’}{‘女性’}{‘女性’}
G (1:5)
ans =.5×12 2 1 1 1

分裂高度变量分为两组高度使用G.应用的意思是函数。这些组分别包含女性和男性患者的平均身高。

splitapply(@均值,高度,g)
ans =.2×165.1509 69.2340

根据性别和吸烟者的身份,计算患者分组的平均血压。

从数据文件中加载患者的血压读数、性别和吸烟数据患者

加载病人谁是收缩压舒张压性别吸烟者
名称大小字节类属性舒张期100x1 800双性别100x1 11412细胞吸烟者100x1 100逻辑收缩期100x1 800双

使用关于患者的性别和吸烟信息指定组。G包含一到四个的整数,因为有四种可能的值组合吸烟者性别

g = findgroups(吸烟者,性别);g(1:10)
ans =.10×14 2 1 1 1 1 3 2 2 1

计算各组的平均血压。

飞艇=透明度(@均值,收缩,g);MilitDiaStolic = Splitapply(@平均值,舒张,G);MBP = [均衡,意味着]
MBP =.4×2119.4250 79.0500 119.3462 79.8846 129.0000 89.2308 129.5714 90.3333

计算患者组的中位数高度,并将结果显示在表格中。要定义患者组,请使用来自的附加输出参数findgroups.

从数据文件中载入病人的身高和性别患者

加载病人谁是性别高度
名称大小字节类属性性别100x1 11412细胞高度100x1 800双

通过性别指定组findgroups..输出参数中的值性别定义组findgroups.在分组变量中查找。

(G,性别)= findgroups(性别);

计算中值高度。创建一个包含中值高度的表。

Medianheight = Splitapply(@中位数,高度,g);T =表(性别,中间海洋)
T =2×2表性别medianHeight  __________ ____________ {' 女性的65{‘男性’}69}

计算各组患者的平均血压,并将结果显示在表格中。若要定义患者组,请使用findgroups.

从数据文件中加载100名患者的血压读数、性别和吸烟数据患者

加载病人谁是收缩压舒张压性别吸烟者
名称大小字节类属性舒张期100x1 800双性别100x1 11412细胞吸烟者100x1 100逻辑收缩期100x1 800双

使用关于患者的性别和吸烟信息指定组。计算每组的平均血压。输出参数上的值性别吸烟者定义组findgroups.在分组变量中查找。

[g,性别,吸烟者] = findgroups(性别,吸烟者);飞艇=透明度(@均值,收缩,g);MilitDiaStolic = Splitapply(@平均值,舒张,G);

创建一张表,其中每组患者的平均血压。

T =表(性别、吸烟、meanSystolic meanDiastolic)
T =4×4表性别吸烟者meanSystolic meanDiastolic  __________ ______ ____________ _____________ {' 女性的}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

使用桌子中的分组变量计算患者的平均血压。

将10名患者的性别和吸烟数据加载到桌子上。

加载病人T =表(性别,吸烟者);T(1:5,:)
ans =5×2表性别吸烟__________ ______ {'男性'}真实{男性'}假{女性'}假{女性'}假{女性'}假

指定使用性别吸烟者变量T.

G = findgroups (T);

根据数据变量计算平均血压收缩压舒张压

飞艇=透明度(@均值,收缩,g);MilitDiaStolic = Splitapply(@平均值,舒张,G);MBP = [均衡,意味着]
MBP =.4×2119.4250 79.0500 129.0000 89.2308 119.3462 79.8846 129.5714 90.3333

创建一个按性别和吸烟或不吸烟状态分组的患者平均血压表。

将患者的性别和吸烟数据载入表格。

加载病人T =表(性别,吸烟者);

指定使用性别吸烟者变量T..输出表t识别组。

[g,tid] = findgroups(t);t
tid =4×2表性别吸烟__________ ______ {女性'}假{女性'}真实{男性'}假{男性'}真实

根据数据变量计算平均血压收缩压舒张压.附录意味着血压t

tid.meansystolic = splitapply(@均值,收缩,g);tid.meandiaastolic = splitapply(@均值,舒张,g)
tid =4×4表性别吸烟者手段意味着_______________________________________________________

输入参数

全部收缩

分组变量,指定为向量,字符向量的单元格数组或字符串数​​组。唯一的价值一种确定组。

如果一种是向量,那么它可以是数字或数据类型分类calendarDuration约会时间期间逻辑,或字符串

分组变量,指定为表。findgroups.将每个表变量视为单独的分组变量。变量可以是数字或数据类型分类calendarDuration约会时间期间逻辑,或字符串

输出参数

全部收缩

组号,作为正整数向量返回。为N组中确定的分组变量,在1和之间的每个整数N指定一组。G包含其中任何分组变量包含一个空字符向量或,或未定义的分类值。

  • 如果分组变量是向量,那么G并且分组变量都是相同的大小。

  • 如果分组变量在表中,则G等于表的行数。

标识每个组的值,作为字符向量的向量或单元格数组返回。价值ID是排序的独特价值一种

标识每个组的唯一值作为表返回。变量t的对应变量是否有唯一的排序值T..然而,tT.不需要有相同的行数。

更多关于

全部收缩

Split-Apply-Combine工作流

分裂申请结合工作流在数据分析中很常见。在这个工作流中,分析师将数据分成组,对每个组应用一个功能,并合并结果。该图表显示了一个典型的工作流示例,以及由findgroups.splitapply

扩展功能

介绍了R2015b