主要内容

findgroups

查找组并返回组号

描述

例子

G= findgroups (一个返回G,从分组变量创建的组编号的向量一个.输出参数G包含1到的整数值N,表明N不同的群体N独特的价值观一个.例如,如果一个{' b ', ' ', ' ', ' b '},然后findgroups返回G作为[2 1 1 2].您可以使用G将数据组从其他变量中分离出来。使用G的输入参数裂开在里面分体式应用组合工作流程

findgroups处理空字符向量和NaT,和未定义的分类值一个作为缺失的值和返回作为对应的元素G

例子

G= findgroups (A1,…)创建组号A1,…,一个.的findgroups函数将组定义为跨值的唯一组合A1,…,一个.例如,如果A1{' a ', ' a ', ' b ', ' b '}A2[0 1 0 0],然后findgroups (A1, A2)返回G作为[1 2 3 3],因为组合“b”0发生两次。

例子

GID) = findgroups (一个还返回每个组的唯一值ID.例如,如果一个{' b ', ' ', ' ', ' b '},然后findgroups返回G作为[2 1 1 2]ID作为{' a ', ' b '}.的参数一个ID是相同的数据类型,但不需要与大小相同。

例子

G, ID1、……,IDN) = findgroups (A1,…,一个)也返回每个组的唯一值ID1、…,印度尼西亚.这些值跨越ID1、…,印度尼西亚定义组。例如,如果A1{' a ', ' a ', ' b ', ' b '}A2[0 1 0 0],然后findgroups (A1, A2)返回G作为[1 2 3 3],ID1ID2下作为{' a ', ' a ', ' b '}(0 1 0)

例子

G= findgroups (T返回G,由表中的变量创建的组号向量T.的findgroups函数处理其中的所有变量T作为分组变量。

例子

GTID) = findgroups (T同样的回报TID,该表包含每个组的唯一值。TID包含跨变量的唯一值的独特组合T.中的变量TTID具有相同的名称,但表不必具有相同的行数。

例子

全部折叠

使用组号将患者的身高数据按性别分组。然后计算每组的平均身高。

从数据文件加载患者高度和性格patients.mat

负载耐心性别高度
名称大小字节类属性性别100x1 11412细胞高度100x1 800双

指定组的性别findgroups

G = findgroups(性别);

比较的前五个元素性别G.在哪里性别包含“女”G包含1.在哪里性别包含“男”G包含2

性别(1:5)
ans =5x1细胞{“男性”}{‘男性’}{‘女性’}{‘女性’}{‘女性’}
G (1:5)
ans =5×12 2 1 1 1

分裂高度变量分为两组高度使用G.应用意思功能。这些组分别含有雌性和男性患者的平均高度。

splitapply (@mean、身高、G)
ans =2×165.1509 - 69.2340

根据性别和吸烟者的身份,计算患者分组的平均血压。

从数据文件中加载患者的血压读数、性别和吸烟数据patients.mat

负载耐心收缩压舒张性别吸烟者
名称大小字节类属性舒张期100x1 800双性别100x1 11412细胞吸烟者100x1 100逻辑收缩期100x1 800双

使用患者的性别和吸烟信息指定组。G包含从1到4的整数,因为从的值有四种可能的组合吸烟者性别

G = findgroups(吸烟、性别);G (1:10)
ans =10×14 2 1 1 1 1 3 2 2 1

计算各组的平均血压。

meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);mBP = [meanSystolic meanDiastolic]
mBP =4×2119.4250 79.0500 119.3462 79.8846 129.0000 89.2308 129.5714 90.3333

计算患者组的中位数高度,并将结果显示在表格中。要定义患者组,请使用来自的附加输出参数findgroups

从数据文件加载患者高度和性格patients.mat

负载耐心性别高度
名称大小字节类属性性别100x1 11412细胞高度100x1 800双

指定组的性别findgroups.输出参数中的值性别定义以下组findgroups在分组变量中查找。

(G,性别)= findgroups(性别);

计算中值高度。创建一个包含中值高度的表。

medianHeight = splitapply (@median、身高、G);T =表(性别、medianHeight)
T =2×2表性别中间海运__________ ____________ {女性'} 65 {'男性'} 69

计算各组患者的平均血压,并将结果显示在表格中。若要定义患者组,请使用findgroups

从数据文件中加载100名患者的血压读数、性别和吸烟数据patients.mat

负载耐心收缩压舒张性别吸烟者
名称大小字节类属性舒张期100x1 800双性别100x1 11412细胞吸烟者100x1 100逻辑收缩期100x1 800双

使用患者的性别和吸烟信息指定组。计算各组的平均血压。跨输出参数的值性别吸烟者定义以下组findgroups在分组变量中查找。

(G,性别,吸烟者)= findgroups(性别、吸烟);meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);

为每一组患者创建一个平均血压表。

T =表(性别、吸烟、meanSystolic meanDiastolic)
T =4×4表性别吸烟者meanSystolic meanDiastolic  __________ ______ ____________ _____________ {' 女性的}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

使用表格中的分组变量计算患者的平均血压。

将100名患者的性别和吸烟数据载入一个表格。

负载耐心T =表(性别、吸烟);: T (1:5)
ans =.5×2表性别吸烟  __________ ______ {' 男性的}真{‘男性’}假{‘女性’}假{‘女性’}假{‘女性’}假

指定使用性别吸烟者变量T

G = findgroups (T);

根据数据变量计算平均血压收缩压舒张

meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);mBP = [meanSystolic meanDiastolic]
mBP =4×2119.4250 79.0500 129.0000 89.2308 119.3462 79.8846 129.5714 90.3333

创建一个按性别和吸烟或不吸烟状态分组的患者平均血压表。

将患者的性别和吸烟数据载入表格。

负载耐心T =表(性别、吸烟);

指定使用性别吸烟者变量T.输出表TID识别组。

(G, TID) = findgroups (T);TID
TID =4×2表性别吸烟  __________ ______ {' 女性的}假{‘女性’}真{‘男性’}假{‘男性’}真

根据数据变量计算平均血压收缩压舒张.附加平均血压TID

工业贸易署。意思收缩压= splitapply(@mean,Systolic,G); TID.meanDiastolic = splitapply(@mean,Diastolic,G)
TID =4×4表性别吸烟者meanSystolic meanDiastolic  __________ ______ ____________ _____________ {' 女性的}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

输入参数

全部折叠

分组变量,指定为向量、字符向量的单元格数组或字符串数组。中的唯一值一个确定组。

如果一个是向量,那么它可以是数字或数据类型分类calendarDurationdatetime持续时间逻辑,或字符串

分组变量,指定为表。findgroups将每个表变量视为单独的分组变量。变量可以是数字或数据类型分类calendarDurationdatetime持续时间逻辑,或字符串

输出参数

全部折叠

组号码,作为正整数的向量返回。为了N在分组变量中标识的组,每个整数1之间N指定一组。G包含任何分组变量包含空字符向量或aNaT,或未确定的分类值。

  • 如果分组变量是向量,那么G分组变量的大小都是一样的。

  • 如果分组变量位于表中,则长度G等于表的行数。

标识每个组的值,作为字符向量的向量或单元格数组返回。的值ID排序的值是唯一的吗一个

标识每个组的惟一值,作为表返回。的变量TID的对应变量是否有唯一的排序值T.然而,TIDT不需要有相同的行数。

更多关于

全部折叠

分体式应用组合工作流程

Split-Apply-Combine工作流在数据分析中很常见。在这个工作流中,分析师将数据分成组,对每个组应用一个功能,并合并结果。该图表显示了一个典型的工作流示例,以及由findgroups裂开

扩展功能

介绍了R2015b