groupcounts
组元素个数
语法
描述
表数据
数组的数据
例子
组表变量
根据表格数据计算每一组的元素数量。
创建表T
其中包含了八个人的信息。
健康状态=分类([“穷”;“好”;“公平”;“公平”;“穷”;“优秀”;“好”;“优秀”]);吸烟者=合乎逻辑的([1;0;0;1;1;0;0;1);重量= [176; 153; 131; 133; 119; 120; 140; 129]; T = table(HealthStatus,Smoker,Weight)
T =8×3表健康状况吸烟者体重____________ ____________差真176好假153一般假131一般真133差真119极好假120好假140极好真129
按健康状况分组,并返回每组的人数和百分比。
G1 = groupcounts(T,“HealthStatus”)
G1 =4×3表HealthStatus GroupCount Percent ____________ __________ _______优秀2 25一般2 25良好2 25较差2 25
将个体按健康状况和吸烟状况分组,并返回每组的人数和百分比。默认情况下,groupcounts
抑制零元素的组,因此不返回分组变量值的某些惟一组合。
G2 = groupcounts(T,[“HealthStatus”,“抽烟”])
G2 =6×4表HealthStatus吸烟者GroupCount百分比____________ ______ __________ _______优秀假1 12.5优秀真1 12.5一般假1 12.5一般真1 12.5良好假2 25较差真2 25
若要为每个组(包括元素为零的组)返回一行,请指定IncludeEmptyGroups
作为真正的
.
G3 = groupcounts(T,[“HealthStatus”,“抽烟”),“IncludeEmptyGroups”,真正的)
G3 =8×4表HealthStatus吸烟者GroupCount百分比____________ ______ __________ _______优秀假1 12.5优秀真1 12.5一般假1 12.5一般真1 12.5良好假2 25良好真0 0较差假0 0较差真2 25
指定组箱
按照指定的箱子对数据进行分组。
创建一个时间表,其中包含一个月内几天的销售信息。
时间戳=日期时间([2017 3 4;2017 3 2;2017 3 15;2017 3 10;...2017 3 14;2017 3 31;2017 3 25;...2017 3 29;2017 3 21;2017 3 18]);利润= [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';ItemsSold = [14 13 8 5 10 16 8 6 7 11]';TT =时间表(时间戳,利润,售出物品)
TT =10×2时间表销售时间戳利润项目___________ ______ _________ 2017年3月04日- 2032 14 2017年3月02日- 3071 13 2017年3月15日- 1185 8 2017年3月10日- 2587 5 2017年3月14日- 1998年10 2017年3月31日- 2899 16 2017年3月25日- 3112 8 2017年3月29日- 909 6 2017年3月21日- 2619 7 2017年3月18日- 3085 11
根据销售的总物品计算组数,将组分成物品编号的间隔。
G = groupcounts(TT,“ItemsSold”,[0 4 8 12 16])
G =3×3表disc_ItemsSold GroupCount百分比 ______________ __________ _______ [ 4, 8) 3 30[8、12)4 30 40(12、16)3
按星期的一天计算分组计数。
G = groupcounts(TT,“时间戳”,“dayname”)
G =5×3表dayname_TimeStamps GroupCount百分比__________________ _________________ Tuesday 2 20 Wednesday 2 20 Thursday 1 10 Friday 2 20 Saturday 3 30
查找重复的数组元素
确定向量中哪些元素出现多次。
创建一个值在1到5之间的列向量。
A = [1 1 2 2 3 5 3 3 1 4]';
确定向量中唯一的组并计算组成员。
[B,BG] = groupcounts(A)
B =5×13 2 3 1 1
BG =5×11 2 3 4 5
通过为计数大于1的组创建逻辑索引,确定向量中哪些元素出现了一次以上。索引到组中以返回重复的向量元素。
重复= BG(B > 1)
重复的=3×11 2 3
向量输入的多个分组向量
计算按健康状况和吸烟状况分组的一组人的组数。
将八个个体的信息存储为三个不同类型的向量。
健康状态=分类([“穷”;“好”;“公平”;“公平”;“穷”;“优秀”;“好”;“优秀”]);吸烟者=合乎逻辑的([1;0;0;1;1;0;0;1);重量= [176; 153; 131; 133; 119; 120; 140; 129];
按健康状况和吸烟状况分组,计算分组计数。指定三个输出也返回组BG
以及群体计数百分比英国石油公司
.
BG
是一个单元格数组,其中包含两个向量,在逐行查看组的元素时描述组。例如,第一行BG {1}
指示第一组中的个人具有健康状态优秀的
的第一行BG {2}
表明他们不吸烟。最后,英国石油公司
中对应组的每个组中成员的百分比BG
.
[B,BG,BP] = groupcounts({健康状态,吸烟者},“IncludeEmptyGroups”,真正的);B
B =8×11 1 1 1 2 0 0 2
BG {1}
ans =8 x1分类优秀优秀优秀优秀优秀优秀优秀优秀可怜可怜
BG {2}
ans =8x1逻辑阵列0 1 1 1 0 1 1 0 1 1
英国石油公司
英国石油(BP) =8×112.5000 12.5000 12.5000 12.5000 25.0000 00 25.0000
输入参数
T
- - - - - -输入表
表格|时间表
输入表,指定为表或时间表。
一个
- - - - - -输入数组
列向量|矩阵|单元阵列
指定为列向量的输入数组、存储为矩阵的列向量组或列向量的单元格数组、字符行向量或矩阵。
groupvars
- - - - - -将变量或向量分组
标量|向量|矩阵|单元阵列|函数处理|表格vartype
下标
分组变量或向量,指定为本表中的一个选项。对于表格或时间表输入数据,groupvars
指示使用哪些变量来计算数据中的组。未指定的其他变量groupvars
不被操作,也不传递到输出。
选项 | 描述 | 例子 |
---|---|---|
变量名 | 指定单个表变量名的字符向量或字符串标量 |
|
变量名向量 | 字符向量或字符串数组的单元格数组,其中每个元素都是一个表变量名 |
|
变量指标的标量或向量 | 表变量索引的标量或向量 |
|
逻辑向量 | 一种逻辑向量,其每个元素对应于一个表变量,其中 |
|
函数处理 | 接受表变量作为输入并返回逻辑标量的函数句柄 |
|
vartype 下标 |
类生成的表下标 |
|
例子:groupcounts (T,“Var3”)
groupbins
- - - - - -装箱计划
“没有”
(默认)|标量|向量|单元阵列
分箱方案,指定为以下选项之一:
“没有”
,表示没有垃圾箱二进制边的列表,指定为数值向量或
datetime
向量为datetime
将变量或向量分组指定为正整数标量的箱的数量
一种时间持续时间,指定为类型的标量
持续时间
或calendarDuration
指示bin宽度(用于datetime
或持续时间
仅分组变量或向量)列出每个分组变量或向量的分箱方法的单元格数组
一个时间箱
datetime
而且持续时间
只对变量或向量进行分组,指定为这些字符串之一。价值 描述 数据类型 “第二”
每个箱子是1秒。
datetime
而且持续时间
“一分钟”
每个箱子是1分钟。
datetime
而且持续时间
“小时”
每个箱子是1小时。
datetime
而且持续时间
“天”
每个箱子是一个日历日。这个值考虑了夏令时的变化。
datetime
而且持续时间
“周”
每个箱子是一个日历周。 datetime
只有“月”
每个箱子是一个日历月。 datetime
只有“季”
每个箱子是一个日历季度。 datetime
只有“年”
每个箱子是一个日历年。这个值表示闰日。
datetime
而且持续时间
“十年”
每个箱子是10年(10个日历年)。 datetime
只有“世纪”
每个箱子代表一个世纪(100日历年)。 datetime
只有“secondofminute”
箱子从0秒到59秒。
datetime
只有“minuteofhour”
箱子是0到59的分钟。
datetime
只有“hourofday”
箱子的单位是从0到23。
datetime
只有“dayofweek”
箱子是从1号到7号。一周的第一天是星期天。
datetime
只有“dayname”
箱子是完整的日期名称,例如 “星期天”
.datetime
只有“dayofmonth”
箱子是从1到31的天。 datetime
只有“dayofyear”
箱是从1到366。 datetime
只有“weekofmonth”
箱子是从1到6的星期。 datetime
只有“weekofyear”
箱子是从1到54的周。 datetime
只有“monthname”
bin是完整的月份名称,例如 “1月”
.datetime
只有“monthofyear”
箱子是从1到12的月份。
datetime
只有“quarterofyear”
箱子是从1到4的四分之一。 datetime
只有
当指定多个分组变量或向量时,可以提供一个应用于所有分组变量或向量的分箱方法,或者为每个分组变量或向量提供包含分箱方法的单元格数组,例如{"none",[0 2 4 Inf]}
.
名称-值参数
指定可选参数对为Name1 = Value1,…,以=家
,在那里的名字
参数名称和价值
对应的值。名称-值参数必须出现在其他参数之后,但对的顺序无关紧要。
例子:G = groupcounts(T,groupvars,groupbins,IncludedEdge="right")
在R2021a之前,使用逗号分隔每个名称和值,并将其括起来的名字
在报价。
例子:G = groupcounts(T,groupvars,groupbins,"IncludedEdge","right")
IncludedEdge
- - - - - -包含箱边
“左”
(默认)|“正确”
包含的bin边,指定为任意一个“左”
或“正确”
,表示包含bin间隔的哪一端。
此名称-值参数仅当groupbins
指定后,该值应用于所有分组变量或向量的所有分组方案。
IncludeMissingGroups
- - - - - -缺失群体指标
真正的
或1
(默认)|假
或0
缺失组指示符,指定为数字或逻辑1
(真正的
)或0
(假
).当的值IncludeMissingGroups
是真正的
,groupcounts
显示由缺失值组成的组,例如南
.当的值IncludeMissingGroups
是假
,groupcounts
不显示缺失的值组。
IncludeEmptyGroups
- - - - - -空组指示器
假
或0
(默认)|真正的
或1
空组指示符,指定为数字或逻辑0
(假
)或1
(真正的
).当的值IncludeEmptyGroups
是假
,groupcounts
不显示元素为零的组。当的值IncludeEmptyGroups
是真正的
,groupcounts
显示空组。
输出参数
G
-输出表
表格
输出表为表或时间表输入数据,作为表返回。G
包含计算的组、每个组中的元素数量以及每个组计数表示的百分比。类返回的顺序对输出组进行排序独特的
函数与“排序”
选择。
B
-小组计数
列向量
数组输入数据的组计数,作为列向量返回。B
包含每个组中的元素数量。
BG
——组
列向量|单元格列向量数组
组用于数组输入数据,作为列向量或列向量的单元格数组返回。类返回的顺序对输出组进行排序独特的
函数与“排序”
选择。
对于多个输入向量,BG
包含相等长度的列向量的单元格数组。中所有向量的一行元素中包含了每个组的信息BG
.每个组映射到输出数组的相应行B
.
英国石油公司
-组计数百分比
列向量
数组输入数据的组计数百分比,作为列向量返回。英国石油公司
包含范围内的百分比[0, 100)
对于每一组B
.
提示
当打许多电话给
groupcounts
,考虑将分组变量转换为类型分类
或逻辑
在可能的情况下提高性能。例如,如果您有一个字符串数组分组变量(如HealthStatus
与元素“穷”
,“公平”
,“好”
,“优秀”
),您可以使用命令将其转换为类别变量分类(HealthStatus)
.
扩展功能
高大的数组
使用行数超过内存容量的数组进行计算。
使用注意事项和限制:
第一个输入参数不支持单元格数组。金宝app
的
groupvars
参数不支持函数句柄。金宝app的
IncludeEmptyGroups
不支持名称-值参数。金宝app与内存中的组相比,组的顺序可能不同
groupcounts
计算。当按离散的datetime数组分组时,分类组名称与内存中的不同
groupcounts
计算。
有关更多信息,请参见高大的数组.
C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。
使用注意事项和限制:
除输入数据外,所有输入参数必须为常量。
不支持稀疏输入。金宝app
不支持datetime或duration数据金宝app的分箱方案。
如果组变量的数量在运行时可以改变,则第二次输出
BG
是单元格数组。
线程环境
使用MATLAB®在后台运行代码backgroundPool
或使用并行计算工具箱™加速代码ThreadPool
.
这个函数完全支持基于线程的环境。金宝app有关更多信息,请参见在线程环境中运行MATLAB函数.
版本历史
在R2019a中引入R2022a:代码生成支持金宝app
的C或c++代码groupcounts
函数。有关使用说明和限制,请参见C/ c++代码生成.
R2021a:自动包含在表格
输出
当groupcounts
对表或时间表中的数据进行操作,则输出包含用于百分比的附加表变量。百分比在这个范围内[0, 100)
和都包含在表变量中百分比
.
任何引用特定表变量的代码都不受影响。但是,您可能需要更新依赖于输出表中变量数量的代码。
另请参阅
功能
实时编辑任务
打开举例
Vous possédez une版本modifiée de cet举例。Souhaitez-vous ouvrir cet示例avec vos修改?
对MATLAB
Vous avez cliqué sur un lien qui对应à cette命令MATLAB:
倒exécuter la command, saisissez-la dans la fenêtre de command de MATLAB。Les navigateurs web ne 金宝appsupport pas Les command MATLAB。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。