主要内容

历史记录

柱状图箱数

描述

例子

N边缘) = histcounts (X分割X值放入容器,并返回每个容器中的计数以及容器边。的历史记录函数使用一种自动装箱算法,该算法返回具有统一宽度的箱子,所选的箱子覆盖X并揭示了分布的潜在形状。

例子

N边缘) = histcounts (Xnbins.使用标量指定的多个存储箱,nbins.

例子

N边缘) = histcounts (X边缘排序X进入带有载体指定的箱边的垃圾箱,边缘.价值x(i)在里面k如果边缘(k)≤.x(i)<边(k+1). 最后一个箱子还包括右箱子边缘,因此它包含x(i)如果边(end-1)≤.x(i)≤.边缘(结束)

例子

N边缘箱子) = histcounts (___还返回一个索引数组,箱子,使用任何先前的语法。箱子是与相同大小的数组X其元素是中相应元素的bin索引X. 中的元素数knnz(bin == k),这与N (k)

例子

N= histcounts(C, 在哪里C是一个类别数组,返回一个向量,N,表示中元素的数量C其值等于每个值C的类别。N每个类别都有一个元素C

N= histcounts(C类别仅计算元素C哪个值等于由类别

例子

N类别) = histcounts (___还返回与中的每个计数对应的类别N对分类数组使用前面的任一语法。

例子

___) = histcounts (___名称、值使用一个或多个指定的附加选项名称、值使用前面语法中的任何输入或输出参数组合对参数进行配对。例如,可以指定'binwidth'和标量调整箱的宽度以进行数字数据。对于分类数据,您可以指定'正常化'和任何一种“伯爵”“计数密度”“概率”“pdf”'cumcount', 或者'CDF'

例子

全部崩溃

将100个随机值分配到箱中。历史记录自动选择适当的仓宽以显示数据的底层分布。

x = randn(100,1);[N,边]=历史计数(X)
N =1×72 17 28 32 16 3 2
边缘=1×8-3 -2 -1 0 1 2 3 4

将10个数字分配成6个等间隔的箱。

X = [2 3 5 7 11 13 17 19 23 29];[n,边] = histcounts(x,6)
N =1×62 2 2 1 1
边缘=1×70 4.9000 9.8000 14.7000 19.6000 24.5000 29.4000

将1000个随机数字分配到容器中。用vector定义bin边,其中第一个元素是第一个箱子的左边,最后一个元素是最后一个箱子的右边。

X = randn (1000 1);Edges = [-5 -4 -1 -0.5 0 0.5 1 2 4 5];N = histcounts (X,边缘)
N =1×100 24 149 142 195 200 154 111 25 0

将小于100的所有素数分发给箱子。指定'正常化'作为“概率”致力于垃圾箱计数总和(n)1.也就是说,每个箱数代表观察到在该箱内的概率。

X =质数(100);[N,边缘]= histcounts (X,'正常化'“概率”
N =1×40.4000 0.2800 0.2800 0.0400
边缘=1×50 30 60 90 120

在-5和5之间分配100个随机整数到bins,并指定'binmethod'作为'整数'若要使用以整数为中心的单位宽度存储单元,请为其指定第三个输出历史记录返回表示数据的bin索引的向量。

X=randi([-5,5],100,1);[N,边,bin]=histcounts(X,'binmethod''整数');

通过计算数字的出现来查找第三个垃圾箱的垃圾箱数量3.在bin索引向量中,箱子.结果与N(3)

count = nnz(bin == 3)
count = 8.

创建表示投票的分类向量。向量中的类别为“是的”“不”, 或者“未决定”

A=[0 0 1 1 0 0 0 0 0南1 0 0 0 1 0 1 0 0 0 1 1 1];C=分类的(A,[10 NaN]{“是的”“不”“未决定”})
C =1x27分类列1到9不是的是的是的不不不不列10到16决定决定是的不不不列17到25没有是的是的不不不是的是的列26日至27日是的是的

确定每个类别中元素的数量。

[n,类别] = histcounts(c)
N =1×311 14 2
类别=1 x3单元格{'是'} {'no'} {'undecided'}

输入参数

全部崩溃

分布在容器中的数据,指定为向量、矩阵或多维数组。如果X那么,它不是一个向量历史记录把它看成一个单列向量,X(:)

历史记录漠视一切价值观。相似地,历史记录忽略了INF.除非BIN边缘明确指定的值INF.作为一个箱子的边缘。

数据类型:单身的|双倍的|int8|int16|INT32.|INT64.|uint8.|uint16|UINT32|uint64|逻辑|日期时间|持续时间

分类数据,指定为分类数组。历史记录忽略未定义的分类值。

数据类型:分类

箱的数量,指定为正整数。如果没有指定nbins.,然后历史记录根据里面的值自动计算要使用多少个箱子X

例子:[n,边] = histcounts(x,15)使用15个垃圾箱。

面元边,指定为向量。边缘(1)是第一个垃圾箱的左边缘,边缘(结束)是最后一个箱子的右边。

用于日期时间和持续时间数据,边缘必须是单调递增顺序的日期时间或持续时间向量。

数据类型:单身的|双倍的|int8|int16|INT32.|INT64.|uint8.|uint16|UINT32|uint64|逻辑|日期时间|持续时间

计数中包含的类别,指定为字符串向量、字符向量的单元格向量或分类向量。默认情况下,历史记录在分类数组中使用每个类别的binC.使用类别改为指定类别的唯一子集。

例子:h = histcounts(c,{'大','small'})只计算类别中的类别数据“大的”“小”

数据类型:单间牢房|分类

名称-值参数

指定可选的逗号分隔的对名称、值论点。姓名参数名和价值是对应的值。姓名必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:name1,value1,...,namen,valuen

例子:[N,边缘]= histcounts (X,“正常化”,“概率”)标准化中的存储箱计数N,以致总和(n)是1。

Bin极限,指定为二元向量,[Bmin,Bmax].此选项仅限符号X介于Bmin.最大包容;也就是说,x(x> = bmin&x <= bmax)

此选项不适用于分类数据。

例子:[N,边缘]= histcounts (X,“BinLimits”,[1,10])只能禁止值X介于110包含全部费用

Binning算法,指定为此表中的值之一。

价值

描述

“汽车”

默认值“汽车”算法选择一个仓宽来覆盖数据范围,并揭示底层分布的形状。

“斯科特。”

如果数据接近正态分布,Scott规则是最优的,但也适用于大多数其他分布。它的箱宽为3.5 * std(x(:))* numel(x)^( - 1/3)

“fd”

Freedman-Diaconis规则对数据中的异常值不太敏感,可能更适合于具有重尾分布的数据2 * IQR(X(:))* numel(x)^( - 1/3), 在哪里位差是的四分位范围X

'整数'

整数规则对于整数数据很有用,因为它为每个整数创建一个bin。它使用的仓宽为1,并将仓边放在整数中间。为了防止意外创建过多的容器,限制65536个容器(216)可以使用此规则创建。如果数据范围大于65536,则使用更宽的箱。

请注意

'整数'不支持日期时间或持金宝app续时间数据。

“斯特格斯”

斯特奇斯的规则是一个简单的规则,因为它的简单而受欢迎。它选择箱子的数量ceil(1+log2(numel(X)))

'sqrt'

平方根规则是另一个在其他软件包中广泛使用的简单规则。它选择箱子的数量装天花板(√元素个数(X)))

历史记录并不总是使用这些精确的公式来选择箱子的数量。有时会稍微调整桶的数量,使桶的边缘落在“好的”数字上。

对于datetime数据,bin方法可以是以下时间单位之一:

“第二” “月”
“一分钟” “四分之一”
'小时' '年'
'日' “十年”
'星期' '世纪'

对于持续时间数据,BIN方法可以是这些时间单位之一:

“第二” '日'
“一分钟” '年'
'小时'

如果您指定宾法使用datetime或duration数据,然后历史记录最多可使用65536个箱子(或2个16)。如果指定的存储箱持续时间需要更多存储箱,则历史记录使用与最大箱数相对应的较大箱宽。

此选项不适用于分类数据。

例子:[n,边缘] = histcounts(x,'binmethod','整数')使用以整数为中心的容器。

容器的宽度,指定为标量。如果您指定箱宽,然后历史记录可以使用最多65,536个垃圾箱(或216).如果指定的仓宽需要更多的仓,则历史记录使用与最大箱数相对应的较大箱宽。

对于datetime和duration数据,的值'binwidth'可以是标量持续时间或日历持续时间。

此选项不适用于分类数据。

例子:[n,边缘] = histcounts(x,'binwidth',5)使用宽度为5的垃圾箱。

规范化类型,指定为此表中的一个值。每个箱子

  • v 是bin值。

  • c 是存储箱中的元素数。

  • w 是垃圾箱的宽度。

  • N 是输入数据中的元素数。如果数据包含,则此值可以大于装箱数据NaT, 或者<未定义>值,或者如果某些数据超出bin限制。

价值 本值 笔记
“伯爵”(默认)

v c

  • 计数或观察的频率。

  • 箱子值的总和小于或等于元素个数(X).总和小于元素个数(X)只有在箱中不包含一些输入数据时。

  • 对于分类数据,箱子值的总和是元素个数(X)总和(成员(X(:),类别))

“计数密度”

v c w

  • 计数或频率按箱宽度缩放。

  • 对于分类数据,这与“伯爵”

请注意

“计数密度”不支持日期时间或持金宝app续时间数据。

'cumcount'

v j 1 c j

  • 累计计数。每个箱子的值是该箱子和之前所有箱子中观察到的累计数量。

  • 最后一个箱子的值小于或等于元素个数(X)

  • 对于分类数据,最后一个箱子的值小于或等于元素个数(X)总和(成员(X(:),类别))

“概率”

v c N

  • 相对概率。

  • bin值之和小于或等于1

“pdf”

v c N w

  • 概率密度函数估计。

  • 对于分类数据,这与“概率”

请注意

“pdf”不支持日期时间或持金宝app续时间数据。

'CDF'

v j 1 c j N

  • 累积密度函数估计。

  • N(结束)是小于还是等于1

例子:[n,边] = histcounts(x,'归一化','pdf')用概率密度函数估计装箱数据。

输出参数

全部崩溃

垃圾箱计数,作为行矢量返回。

Bin边,作为向量返回。边缘(1)是第一个垃圾箱的左边缘,边缘(结束)是最后一个箱子的右边。

垃圾箱指数,返回与相同尺寸的数组X.中的每个元素箱子描述中包含相应元素的编号箱子X

的值0在里面箱子表示不属于任何存储箱的元素(例如价值)。

包含在计数中的类别,作为字符向量的单元格向量返回。类别包含C对应于中的每个计数N

提示

  • 行为历史记录类似于离散化功能。使用历史记录找到每个垃圾箱中的元素数。另一方面,使用离散化查找每个元素所属的容器(不计算)。

扩展能力

R2014b中引入