主要内容

节目

直方图垃圾箱数量

描述

例子

N边缘) = histcounts (X分区X值,并返回每个箱子中的计数,以及箱子的边。的节目函数使用自动排放算法,返回具有均匀宽度的箱,选择覆盖元素范围X并揭示了分布的潜在形状。

例子

N边缘) = histcounts (Xnbins.使用标量指定的多个箱子,nbins.

例子

N边缘) = histcounts (X边缘排序X进入带有载体指定的箱边的垃圾箱,边缘.价值x(i)在里面k如果边缘(k)≤.x(i)<边缘(k + 1).最后一个垃圾箱还包括右边的边缘,所以它包含x(i)如果边(end-1)≤.x(i)≤.边缘(结束)

例子

N边缘箱子) = histcounts (___还返回索引数组,箱子,使用以前的任何语法。箱子是与尺寸相同的数组X其元素是相应元素的垃圾箱指数X.中的元素数量knnz(bin == k),这与N (k)

例子

N= histcounts(C, 在哪里C是一个分类数组,返回向量,N,表示元素的数量C其值等于每个值C的类别。N每个类别都有一个元素C

N= histcounts(C类别仅计算元素C谁的值等于指定的类别的子集类别

例子

N类别) = histcounts (___还返回对应于每个计数的类别N使用先前的分类阵列中的任何一个语法。

例子

___) = histcounts (___名称,价值使用一个或多个指定的其他选项名称,价值使用前面语法中的任何输入或输出参数组合对参数。例如,可以指定'binwidth'和标量调整箱的宽度以进行数字数据。对于分类数据,您可以指定'正常化'和任何一种'数数''校长''可能性'“pdf”'cumcount', 或者'CDF'

例子

全部收缩

将100个随机值分配到箱中。节目自动选择适当的箱宽来显示数据的基础分布。

x = randn(100,1);[n,边] = histcounts(x)
N =1×7.2 17 28 32 16 3 2
边缘=1×8.-3 -2 -1 0 1 2 3 4

将10个数字分配成6个等间隔的箱。

X = [2 3 5 7 11 13 17 19 23 29];[n,边] = histcounts(x,6)
N =1×6.2 2 2 1 1
边缘=1×7.0 4.9000 9.8000 14.7000 19.6000 24.5000 29.4000

随机分配1000个数字到箱子里。用一个向量定义容器边缘,其中第一个元素是第一个容器的左边缘,最后一个元素是最后一个容器的右边缘。

X = randn (1000 1);边= [-5 -4 -2 -1 -0.5 0 0.5 1 2 4 5];N = histcounts (X,边缘)
N =1×100 24 149 142 195 200 154 111 25 0

将小于100的所有素数分发给箱子。指定'正常化'作为'可能性'致力于垃圾箱计数总和(n)1.也就是说,每个箱数代表观察到在该箱内的概率。

X =质数(100);[N,边缘]= histcounts (X,'正常化''可能性'
N =1×40.4000 0.2800 0.2800 0.0400
边缘=1×50 30 60 90 120

将-5到5之间的100个随机整数分配到bins中,并指定'binmethod'作为'整数'使用以整数为中心的单位宽度箱。指定第三个输出节目返回代表数据的BIN指标的向量。

X = RANDI([ -  5,5],100,1);[n,边缘,bin] = histcounts(x,'binmethod''整数');

通过计算数字的出现来查找第三个垃圾箱的垃圾箱数量3.在bin索引矢量,箱子.结果与n(3)

count = nnz(bin == 3)
count = 8.

创建一个代表投票的分类矢量。矢量中的类别是“是的”“不”, 或者“未定”

a = [0 0 11 1 0 0 0 0 naN naN 1 0 0 0 1 0 1 0 1 0 0 0 11 11 1];C =分类(a,[1 0 nan],{“是的”“不”“未定”})
C =1x27分类第1列到第9列否否是是是是否否否否第10列到第16列未决定未决定是否否否是第17列到第25列否是否是否否否是第26列到第27列是是是

确定属于每个类别的元素的数量。

[n,类别] = histcounts(c)
N =1×311 14 2
类别=1 x3单元格{'是'} {'no'} {'undecided'}

输入参数

全部收缩

要在多个箱子中分布的数据,指定为矢量、矩阵或多维数组。如果X不是矢量,然后节目把它当作一个单列向量,X(:)

节目忽略所有价值观。相似地,节目忽略了INF.除非BIN边缘明确指定的值INF.或者作为一个bin edge。

数据类型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32|UINT64|逻辑|约会时间|持续时间

分类数据,指定为分类数组。节目忽略未定义的分类值。

数据类型:分类

箱子的数量,指定为一个正整数。如果不指定nbins.,然后节目根据中的值自动计算要使用多少个箱子X

例子:[n,边] = histcounts(x,15)使用15个垃圾箱。

Bin边缘,指定为向量。边缘(1)是第一个垃圾箱的左边缘,边缘(结束)是最后一个箱子的右边缘。

用于日期时间和持续时间数据,边缘必须是单调上增加顺序的日期时间或持续时间向量。

数据类型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32|UINT64|逻辑|约会时间|持续时间

计数中包含的类别,指定为字符向量或分类向量的单元格向量。默认,节目在分类数组中使用每个类别的binC.使用类别要指定类别的唯一子集。

例子:h = histcounts(c,{'大','small'})只计算类别中的类别数据'大''小的'

数据类型:细胞|分类

名称值对参数

指定可选的逗号分隔对名称,价值论点。名称参数名和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:[N,边缘]= histcounts (X,“正常化”,“概率”)标准化垃圾箱计数N,这样总和(n)是1。

Bin极限,指定为一个二元向量,[Bmin,Bmax].此选项仅限符号X那介于两者之间Bmin.BMAX.包容;也就是说,x(x> = bmin&x <= bmax)

此选项不适用于分类数据。

例子:[N,边缘]= histcounts (X,“BinLimits”,[1,10])只能禁止值X那是之间的110.包括的。

Binning算法,指定为此表中的值之一。

价值

描述

“汽车”

默认值“汽车”算法选择一个箱宽来覆盖数据范围并显示底层分布的形状。

“斯科特。”

如果数据接近正态分布,则Scott规则是最优的,但也适用于大多数其他分布。它使用箱宽为3.5 * std(x(:))* numel(x)^( - 1/3)

'FD'

Freedman-DiaConis规则对数据中的异常值不太敏感,并且可能更适合具有重型分布的数据。它使用箱宽为2 * IQR(X(:))* numel(x)^( - 1/3), 在哪里位差是四分之一的范围X

'整数'

整数规则对于整数数据很有用,因为它为每个整数创建一个bin。它使用的bin宽度为1,并将bin边放在整数之间的中间。为了防止意外地创建过多的容器,限制为65536个容器(216.)可以使用此规则创建。如果数据范围大于65536,则使用更宽的箱。

请注意

'整数'不支持日期时间或持金宝app续时间数据。

'sturges'

斯特奇斯规则是一个简单的规则,由于其简单性而受到欢迎。它选择箱子的数量CEIL(1 + log2(numel(x)))

'sqrt'

平方根规则是另一个在其他软件包中广泛使用的简单规则。它选择箱子的数量装天花板(√元素个数(X)))

节目并不总是使用这些精确的公式来选择箱子的数量。有时,箱子的数量会稍微调整,以便箱子的边缘落在“好的”数字上。

对于datetime数据,bin方法可以是以下时间单位之一:

“第二” '月'
“一分钟” '25美分硬币'
'小时' '年'
'日' '十年'
'星期' '世纪'

对于持续时间数据,BIN方法可以是这些时间单位之一:

“第二” '日'
“一分钟” '年'
'小时'

如果您指定Binmethod.然后,使用日期时间或持续时间数据节目可以使用最多65,536个垃圾箱(或216.).如果指定的垃圾箱持续时间需要更多的垃圾箱,那么节目使用与最大箱子数量对应的更大的箱子宽度。

此选项不适用于分类数据。

例子:[n,边缘] = histcounts(x,'binmethod','整数')使用以整数为中心的箱。

容器的宽度,指定为标量。如果您指定百宽,然后节目可以使用最多65,536个垃圾箱(或216.).如果指定的箱子宽度需要更多的箱子,那么节目使用与最大箱子数量对应的更大的箱子宽度。

用于日期时间和持续时间数据,值的值'binwidth'可以是标量持续时间或日历持续时间。

此选项不适用于分类数据。

例子:[n,边缘] = histcounts(x,'binwidth',5)使用宽度为5的垃圾箱。

标准化类型,指定为此表中的值之一。每个垃圾箱

  • v 是bin值。

  • c 是垃圾箱中的元素数。

  • w 是垃圾箱的宽度。

  • N 是输入数据中的元素数。如果数据包含,则此值可以大于Binned数据NaT, 或者<未定义>值,或者如果某些数据位于箱子范围之外。

价值 本值 笔记
'数数'(默认)

v c

  • 计数或观测频率。

  • 箱子值的总和小于或等于元素个数(X).和小于元素个数(X)只有在箱中不包含一些输入数据时。

  • 对于分类数据,箱子值的总和是元素个数(X)或者总和(ismember(x(:),类别))

'校长'

v c w

  • 计数或频率按箱宽度缩放。

  • 对于分类数据,这也是如此'数数'

请注意

'校长'不支持日期时间或持金宝app续时间数据。

'cumcount'

v σ. j 1 c j

  • 累计计数。每个bin值是该bin和之前所有bin的累计观测数。

  • 最后一个垃圾箱的值小于或等于元素个数(X)

  • 对于分类数据,最后一个bin的值小于或等于元素个数(X)或者总和(ismember(x(:),类别))

'可能性'

v c N

  • 相对概率。

  • 箱子值的总和小于或等于1

“pdf”

v c N w

  • 概率密度函数估计。

  • 对于分类数据,这与'可能性'

请注意

“pdf”不支持日期时间或持金宝app续时间数据。

'CDF'

v σ. j 1 c j N

  • 累积密度函数估计。

  • N(结束)是小于还是等于1

例子:[n,边] = histcounts(x,'归一化','pdf')使用概率密度函数估计装箱数据。

输出参数

全部收缩

垃圾箱计数,作为行矢量返回。

Bin边,作为一个向量返回。边缘(1)是第一个垃圾箱的左边缘,边缘(结束)是最后一个箱子的右边缘。

垃圾箱指数,返回与相同尺寸的数组X.每个元素箱子描述了编号的bin包含相应的元素X

的值0箱子表示不属于任何垃圾箱的元素(例如,a价值)。

包含在count中的类别,作为字符向量的单元格向量返回。类别包含C对应于每个计数N

尖端

  • 行为节目类似于离散化功能。使用节目找到每个垃圾箱中的元素数。另一方面,使用离散化要找到每个元素所属的bin(不计数)。

扩展能力

在R2014B中介绍