主要内容

groupcounts

群元素数

描述

例子

G= groupcounts (Tgroupvars计算表或时间表中每组数据中的元素数量,并返回一个包含组、它们的计数和每个计数所代表的百分比(0到100)的表。每个组是由组变量的唯一组合定义的groupvars.例如,G = groupcounts (T '性别')返回显示数量的表男性元素的个数元素,以此类推变量中的任何其他类别性别

例子

G= groupcounts (Tgroupvarsgroupbins指定如何将数据装入groupvars.例如,G = groupcounts (T,‘SaleDate’,‘年’)给出年度销售统计和百分比SaleDate

例子

G= groupcounts (___名称,值为任何前面的语法使用一个或多个名称-值对指定附加分组属性。例如,G = groupcounts (T,‘Category1’,‘IncludeMissingGroups’,假)不包括由missing组成的组分类数据显示,<定义>

B= groupcounts (一个返回一个向量,该向量包含在列向量的列向量、矩阵或单元格数组中表示的每个唯一分组向量组合的组计数一个

B= groupcounts (一个groupbins将数据按照groupbins

B= groupcounts (___名称,值使用一个或多个名称-值对指定其他分组属性。

例子

BBG英国石油公司) = groupcounts (一个___也返回组BG和百分比英国石油公司对应于计数B

例子

全部折叠

从表数据中计算组元素的数量。

创建一个包含五个人信息的表。

性别= [“男性”“女性”“男性”“女性”“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);T =表(性别、吸烟、体重)
T =5×3表性别吸烟者体重________ ______ ______“男”真176“女”假163“男”真131“女”假133“男”真119

按性别计算每组元素的数量。

G1 = groupcounts (T)“性别”
G1 =2×3表性别GroupCount百分比  ________ __________ _______ " 女性男性“2 40 3 60

根据性别和吸烟状况计算每一组中元素的数量。默认情况下,groupcounts抑制包含零元素的组,因此不为女性吸烟者或男性非吸烟者返回组。

G2 = groupcounts (T) {“性别”“抽烟”})
G2 =2×4表性别吸烟者GroupCount百分比  ________ ______ __________ _______ " 女性“假2 40“男性“真正3 60

要计算所有组,包括没有元素的组,请指定“IncludeEmptyGroups”参数和值真正的

G3 = groupcounts (T) {“性别”“抽烟”},“IncludeEmptyGroups”,真正的)
G3 =4×4表性别吸烟者群体计数百分比________ ______ __________ _______“女”假2 40“女”真0 0“男”假0 0“男”真3 60

根据指定的bins对数据进行分组。

创建一个时间表,其中包含一个月内的销售信息。

timestamp = datetime([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;...2017年3 14;2017年3 31;2017年3 25;...2017年3 29;2017年3 21;2017 3 18]);利润= [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';TotalItemsSold = [14 13 8 5 10 16 8 6 7 11]';TT =时间表(时间戳,利润,TotalItemsSold)
TT =10×2时间表时间戳利润TotalItemsSold ___________ ______ ______________ 04- march -2017 2032 14 02- march -2017 3071 13 15- march -2017 1185 8 10- march -2017 2587 5 14- march -2017 1998 10 31- march -2017 2899 16 25- march -2017 3112 8 29- march -2017 909 6 21- march -2017 2619 7 18- march -2017 3085 11

根据售出的总商品计算组计数,将组放入商品编号的间隔中。

G = groupcounts (TT,“TotalItemsSold”,[0 4 8 12 16])
G =3×3表disc_TotalItemsSold GroupCount百分比  ___________________ __________ _______ [ 4, 8) 3 30[8、12)4 30 40(12、16)3

按星期的天数计算分组计数。

G = groupcounts (TT,“时间戳”“dayname”
G =5×3表dayname_TimeStamps GroupCount Percent __________________ _________________星期二2 20星期三2 20星期四1 10星期五2 20星期六3 30

确定向量中哪些元素出现了不止一次。

创建一个值在1到5之间的列向量。

V = [1 1 2 2 3 5 3 3 1 4]';

使用groupcounts确定向量中唯一的组并计算组成员。

[gc,毛评点]= groupcounts (v)
gc =5×13 2 3 1 1
毛评点=5×11 2 3 4 5 5

通过为计数大于1的组创建逻辑索引,确定向量中哪些元素出现了不止一次。在组中建立索引,以返回重复的向量元素。

副本= grps(gc > 1)
重复的=3×11 2 3

根据他们的性别和吸烟状况计算四组的数量。

将患者信息存储为三个不同类型的向量。

性别= [“男性”“女性”“男性”“女性”“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);

按性别和吸烟状况分组,计算分组计数。指定三个输出以返回组BG和百分比英国石油公司.的B输出包含每个组的计数,和英国石油公司包含这些计数所代表的百分比。

(B, BG, BP) = groupcounts({性别、吸烟},“IncludeEmptyGroups”,真正的)
B =4×12 0 0 3
BG =1×2单元阵列{4x1 string} {4x1 logical}
英国石油(BP) =4×140 0 0 60

BG是一个单元格数组,其中包含两个向量,在逐行查看组的元素时描述组。例如,的第一行BG {1}说第一组病人是女性,而第一排BG {2}说他们不吸烟。该组的计数为2,在对应的行中找到B

BG {1}
ans =4 x1字符串"female" "female" "male" "male"
BG {2}
ans =4 x1逻辑阵列0 1 0 1

输入参数

全部折叠

输入数据,指定为表或时间表。

输入向量,指定为表示组合向量的列向量、矩阵或列向量的单元格数组。当一个是一个矩阵,组向量是列的。

分组变量或向量,指定为该表中的选项之一。对于表格或时间表的输入数据,groupvars指示使用哪些变量来计算数据中的组。未指定的其他变量groupvars不操作,也不通过输出。

选项 描述 例子
变量名

指定单个表变量名的字符向量或标量字符串

“Var1”

“Var1”

变量名向量

字符向量或字符串数组的单元格数组,其中每个元素是表变量名

{“Var1”“Var2”}

[" Var1”“Var2”)

可变指标的标量或向量

表变量索引的标量或向量

1

[1 3 5]

逻辑向量

逻辑向量,其每个元素对应一个表变量,其中真正的包含相应的变量和不包括它

(真的假的真的)

函数处理

接受表变量作为输入并返回逻辑标量的函数句柄

@isnumeric

vartype下标

属性生成的表下标vartype函数

vartype(数字)

例子:groupcounts (T,“Var3”)

bining方案,指定为以下选项之一:

  • “没有”,表示只根据指定的分组变量返回组

  • 箱边列表,指定为用于数字分组变量的数字向量,或作为datetime向量为datetime分组变量

  • 指定为整数标量的一组容器

  • 指定为类型标量的时间持续时间持续时间calendarDuration,表示仓宽(用于datetime持续时间仅对变量或向量进行分组)

  • 列出每个分组变量或向量的分类规则的单元格数组

  • 时间箱datetime持续时间只分组变量或向量,指定为以下字符向量之一:

    价值 描述 数据类型
    “第二”

    每个箱子是1秒。

    datetime持续时间
    “一分钟”

    每个垃圾桶为1分钟。

    datetime持续时间
    “小时”

    每个垃圾桶是1小时。

    datetime持续时间
    “天”

    每个垃圾箱是1个日历天。这个值说明了夏令时转换。

    datetime持续时间
    “周” 每个垃圾桶是一个日历周。 datetime只有
    “月” 每个垃圾箱是1个日历月。 datetime只有
    “季” 每个箱子是1个日历季度。 datetime只有
    “年”

    每个垃圾桶是1个日历年。该值用于闰日。

    datetime持续时间
    “十年” 每个垃圾桶是1个十年(10个日历年)。 datetime只有
    “世纪” 每个垃圾桶是1个世纪(100个日历年)。 datetime只有
    “secondofminute”

    箱子的时间从0到59秒。

    datetime只有
    “minuteofhour”

    垃圾箱的分钟从0到59。

    datetime只有
    “hourofday”

    垃圾箱的时间从0到23。

    datetime只有
    “dayofweek”

    垃圾箱是从1天到7天。一周的第一天是星期天。

    datetime只有
    “dayname” Bins是完整的日名,例如“星期天” datetime只有
    “dayofmonth” 垃圾桶是1到31天。 datetime只有
    “dayofyear” 垃圾桶是1到366天。 datetime只有
    “weekofmonth” 垃圾箱从1到6周。 datetime只有
    “weekofyear” 垃圾箱从1到54个星期。 datetime只有
    “monthname” bin是完整的月份名称,例如“1月” datetime只有
    “monthofyear”

    垃圾箱是1到12个月。

    datetime只有
    “quarterofyear” 垃圾桶是1到4的四分之一。 datetime只有

当指定多个分组变量或向量时,您可以提供应用于所有分组变量的单一分组规则,或包含每个分组变量的分组方法的单元格数组,例如{'none',[0 2 4 Inf]}

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:G = groupcounts (T groupvars groupbins,‘IncludedEdge’,‘正确的’)

包括仓边,指定为“左”“对”,指示bin间隔的哪个端点是包含的。

此名称-值对只能在groupbins,该值将应用于所有分组变量或向量的所有分类方案。

缺少组指示符,指定为数字或逻辑1真正的)或0).如果参数值为真正的,然后groupcounts显示由缺失值组成的组,例如.如果参数值为,然后groupcounts不显示缺失的值组。

空组指示符,指定为数字或逻辑0)或1真正的).如果参数值为,然后groupcounts不显示元素为零的组。如果参数值为真正的,然后groupcounts显示空组。

输出参数

全部折叠

输出表,作为包含计算组、每个组中的元素数量和每个组计数所代表的百分比的表返回。对于单个分组变量,将根据返回的顺序对输出组进行排序独特的函数与“排序”选择。

非表输入数据的组计数,作为包含每个组中元素数量的列向量返回。

非表输入数据的组,作为列向量的列向量或单元格数组返回。对于单个分组向量,将根据返回的顺序对输出组进行排序独特的函数与“排序”选择。

当你提供多个输入向量时,BG是包含等长列向量的单元格数组。组信息可以通过遍历所有向量的元素行来找到BG.每个组的计数包含在第一个输出参数的相应行中B

非表输入数据的组计数百分比,作为包含每个组计数的百分比的列向量返回B代表。百分比在范围内100年[0]

提示

  • 当打许多电话时groupcounts,考虑将分组变量转换为类型分类逻辑在可能的情况下提高性能。例如,如果您有一个类型为的分组变量字符(如性别与元素“男”“女”),您可以使用该命令将其转换为分类变量分类(性别)

兼容性的考虑

全部展开

行为在R2021a中改变

扩展功能

介绍了R2019a