主要内容

countlabels

清点唯一标签的数量

描述

当您正在处理机器或深度学习分类问题,并希望查看数据集中的标签值的比例时,请使用此函数。

例子

= countlabels (lblsrc中唯一标签类别值的数量lblsrc并返回计数

例子

= countlabels (lblsrc名称,值使用名称-值对指定其他输入参数。例如,“TableVariable”、“颜色”读取对应的标签“颜色”

例子

全部折叠

分类数组

使用类别生成一个类别数组一个BC,D.数组包含每个类别的样本。

lbls =分类([“B”“C”“一个”“D”“B”“一个”“一个”“B”“C”“一个”],...“一个”“B”“C”“D”])
lbls =1 x10分类B c a d B a a B c a

计算数组中唯一标签类别值的数量。

问= countlabels (lbls)
问=4×3表标签数百分比_____ _____ _______ A 4 40 B 3 30 C 2 20 D 1 10

生成具有相同类别的第二个类别数组。该数组包含每个类别的样本和一个缺少值的样本。

mlbls =分类([“B”“C”“一个”“D”“B”“一个”失踪“B”“C”“一个”],...“一个”“B”“C”“D”])
mlbls =1 x10分类第1至9栏B C A D B A  B C

计算数组中唯一标签类别值的数量。缺少值的样本包含在计数中<定义>

mcnt = countlabels (mlbls)
mcnt =5×3表标签计数百分比___________ _____ _______ A 3 30 B 3 30 C 2 20 D 1 10  1 10

字符数组

阅读威廉·莎士比亚的十四行诗fileread函数。从文本中删除所有非字母字符并转换为小写字母。

十四行诗= fileread (“sonnets.txt”);信=低(十四行诗(正则表达式(十四行诗,“[a - z]”)));

数一数十四行诗中每个字母出现的次数。列出最常出现的字母。

问= countlabels(字母);问= sortrows(问,“数”“下”);(问)
ans =8×3表标签计数百分比_____ _____ _______ e 9028 12.298 t 7210 9.8216 o 5710 7.7782 h 5064 6.8982 s 4994 6.8029 a 4940 6.7293 i 4895 6.668 n 4522 6.1599

数字数组

使用poisrand函数从速率参数为3的泊松分布生成一个由1000个随机整数组成的数组。绘制结果的直方图。

N = 1000;林= 3;num = 0 (N, 1);k = 1:N nums(jk) = poisrand(lam);结束直方图(num)

图中包含一个轴对象。坐标轴对象包含一个直方图类型的对象。

计算数组中表示的整数的频率。

毫米= countlabels (num)
毫米=10×3表标签数百分比_____ _____ _______ 0 36 3.6 1 153 15.3 10 1 0.1 2 211 21.1 3 213 21.3 4 184 18.4 5 114 11.4 6 58 5.8 7 20 2 8 10 1
函数num = poisrand (lam)%泊松随机整数使用排斥方法p = 0;num = 1;P <= lam P = P - log(rand);Num = Num + 1;结束结束

创建一个包含两个变量的字符表。第一个变量类型1包含信件的实例P,R.第二个变量类型2包含信件的实例一个B,D

台([=表“P”“R”“P”“Q”“Q”“Q”“R”“P”)”,...“一个”“B”“B”“一个”“D”“D”“一个”“一个”)”,...“VariableNames”,[“类型1”“Type2”]);

计算每个字母在每个表变量中出现的次数。

问= countlabels(资源描述,“TableVariable”类型1的
问=3×3表类型1计数百分比_____ _____ _______ P 3 37.5 Q 3 37.5 R 2 25
问= countlabels(资源描述,“TableVariable”“Type2”
问=3×3表类型2计数百分比_____ _____ _______ A 4 50 B 2 25 D 2 25

创建一个一个rrayDatastore包含表的。

广告= arrayDatastore(资源描述,“OutputType”“相同”);

计算每个字母在每个表变量中出现的次数。

问= countlabels(广告,“TableVariable”类型1的
问=3×3表类型1计数百分比_____ _____ _______ P 3 37.5 Q 3 37.5 R 2 25
问= countlabels(广告,“TableVariable”“Type2”
问=3×3表类型2计数百分比_____ _____ _______ A 4 50 B 2 25 D 2 25

输入参数

全部折叠

输入标签源,指定为其中之一:

  • 一个分类向量。

  • 字符串向量或字符向量的单元格数组。

  • 数字矢量或数字标量的单元格数组。

  • 由逻辑标量组成的逻辑向量或单元阵列。

  • 包含任何先前数据类型的变量的表。

  • 的数据存储readall函数返回任何以前的数据类型。

  • 一个CombinedDatastore对象,该对象包含底层数据存储readall函数返回任何以前的数据类型。在这种情况下,必须指定具有标签值的底层数据存储的索引。

lblsrc必须包含可转换为具有离散类别集的向量的标签。

例子:lblsrc =分类([“B”“C”“A”“E”“B”“A”“A”“B”“C”“A”),(“A”“B”“C”“D”))将标签源创建为带有四个类别的10个样本类别向量:一个BC,D

例子:LBLSRC = [0 7 2 5 11 17 15 7 7 11]将标签源创建为10个示例的数字向量。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑|字符|字符串|表格|细胞|分类

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:‘TableVariable’,‘性’,‘UnderlyingDatastoreIndex’,5读取对应的标签“性”仅在合并数据存储的第五个底层数据存储中。

要读取的表变量,指定为字符向量或字符串标量。如果未指定此参数,则countlabels使用第一个表变量。

底层数据存储索引,指定为整数标量。这个论点适用于以下情况lblsrc是一个CombinedDatastore对象。countlabels方法获取的数据存储中的标签计数UnderlyingDatastores的属性lblsrc

输出参数

全部折叠

唯一的标签计数,返回作为一个表与这些变量:

  • 标签—唯一的标签类别值。如果“TableVariable”,则标签将Name替换为表变量名。

  • —每个标签值的实例数。

  • 百分比—各标签值占比,以百分比表示。

介绍了R2021a