主要内容

边缘

神经网络分类器分类边缘

自从R2021a

    描述

    例子

    e=边缘(Mdl,资源描述,ResponseVarName)返回分类的优势训练的神经网络分类器Mdl使用预测数据表资源描述和类标签ResponseVarName表变量。

    e返回标量值,表示分类的平均利润率。

    e=边缘(Mdl,资源描述,Y)返回分类的分类器的边缘Mdl使用预测数据表资源描述和类标签向量Y

    e=边缘(Mdl,X,Y)返回经过训练的神经网络分类器的分类边界Mdl使用预测数据X和相应的类标签Y

    e=边缘(___,名称,值)指定选项使用一个或多个名称参数除了任何输入参数组合在以前的语法。例如,您可以指定列预测数据对应于观测或供应观察权重。

    请注意

    如果预测数据X或预测变量资源描述包含任何缺失值,边缘函数可以返回NaN。更多细节,请参阅边缘可以返回NaN预测数据缺失值

    例子

    全部折叠

    计算测试集分类的神经网络分类器。

    加载病人从数据集中数据集。创建一个表,每一行对应一个病人和每一列对应一个诊断变量。使用吸烟者变量作为响应变量,其余变量的预测因子。

    负载病人台=表(舒张压、收缩压、性别、身高、体重、年龄、吸烟);

    单独的数据训练集tblTrain和一个测试集tblTest通过使用分层抵抗分区。软件储备大约30%的测试数据集,并使用其余的观察观察的训练数据集。

    rng (“默认”)%的再现性分区c = cvpartition (tbl.Smoker“坚持”,0.30);trainingIndices =培训(c);testIndices =测试(c);tblTrain =(资源(trainingIndices:);tblTest =(资源(testIndices:);

    使用训练集训练神经网络分类器。指定吸烟者列的tblTrain作为反应变量。指定标准化数值预测。

    Mdl = fitcnet (tblTrain,“抽烟”,“标准化”,真正的);

    计算测试集分类的优势。

    e =边缘(Mdl tblTest,“抽烟”)
    e = 0.8657

    的均值分类利润率接近1,这表明该模型总体表现良好。

    进行特征选择通过比较测试集分类的利润率,边缘,错误,和预测。比较的测试集的度量模型训练使用所有测试集的预测指标对模型训练使用只有一个子集的预测。

    加载示例文件fisheriris.csv,其中包含虹膜数据包括花萼长度、宽度萼片,花瓣长度,花瓣宽度,和物种类型。读取文件成一个表。

    fishertable = readtable (“fisheriris.csv”);

    单独的数据训练集trainTbl和一个测试集testTbl通过使用分层抵抗分区。软件储备大约30%的测试数据集,并使用其余的观察观察的训练数据集。

    rng (“默认”)c = cvpartition (fishertable.Species“坚持”,0.3);trainTbl = fishertable(培训(c):);testTbl = fishertable(测试(c):);

    训练一个神经网络分类器使用中的所有预测训练集,并使用所有的预测,除了训练另一个分类器PetalWidth。对于这两种模型,指定物种作为响应变量,预测和规范。

    allMdl = fitcnet (trainTbl,“物种”,“标准化”,真正的);subsetMdl = fitcnet (trainTbl,“物种~ SepalLength + SepalWidth + PetalLength”,“标准化”,真正的);

    两个模型计算测试集分类的利润。因为测试集只包含45观察,显示利润使用条形图。

    对于每个观察,分类边界的区别是真正的类的分类评分和虚假的最大分数类。因为神经网络分类器返回分类后验概率的分数,利润率值接近1表示有信心分类和负利润值指示错误分类。

    tiledlayout (2, 1)%顶轴ax₁= nexttile;allMargins =利润率(allMdl testTbl);栏(ax₁, allMargins)包含(ax₁“观察”)ylabel (ax₁,“保证金”)标题(ax₁,“预测”)%底部轴ax2 = nexttile;subsetMargins =利润率(subsetMdl testTbl);栏(ax2 subsetMargins)包含(ax2,“观察”)ylabel (ax2,“保证金”)标题(ax2,“子集预测”)

    图包含2轴对象。坐标轴对象1标题预测,包含观察,ylabel边缘包含一个对象类型的酒吧。预测的坐标轴对象2标题子集,包含观察,ylabel边缘包含一个对象类型的酒吧。

    比较测试集分类边缘,或意味着利润率的分类,两个模型。

    allEdge =边缘(allMdl testTbl)
    allEdge = 0.8198
    subsetEdge =边缘(subsetMdl testTbl)
    subsetEdge = 0.9556

    根据测试集分类利润率和边缘,模型训练的一个子集预测似乎比模型训练所有的预测因子。

    比较两个模型的测试集分类错误。

    allError =损失(allMdl testTbl);allAccuracy = 1-allError
    allAccuracy = 0.9111
    subsetError =损失(subsetMdl testTbl);subsetAccuracy = 1-subsetError
    subsetAccuracy = 0.9778

    再次,模型训练使用只有一个子集的预测似乎执行比模型训练使用所有的预测因子。

    可视化测试集分类结果采用混淆矩阵。

    allLabels =预测(allMdl testTbl);图confusionchart (testTbl.Species allLabels)标题(“预测”)

    图包含一个ConfusionMatrixChart类型的对象。图表ConfusionMatrixChart标题所有类型的预测。

    subsetLabels =预测(subsetMdl testTbl);图confusionchart (testTbl.Species subsetLabels)标题(“子集预测”)

    图包含一个ConfusionMatrixChart类型的对象。ConfusionMatrixChart类型的图表标题预测的子集。

    模型训练使用所有测试集的分类预测因子四个观察。模型训练使用的一个子集预测分类只有一个测试集的观察。

    鉴于测试集两种模型的性能,考虑使用该模型使用所有的预测,除了训练PetalWidth

    输入参数

    全部折叠

    训练神经网络分类器,指定为一个ClassificationNeuralNetwork模型对象或CompactClassificationNeuralNetwork模型对象返回的fitcnet紧凑的,分别。

    样本数据,指定为一个表。每一行的资源描述对应于一个观察,每一列对应一个预测变量。可选地,资源描述为响应变量可以包含一个额外的列。资源描述必须包含所有的预测用于火车Mdl。多列变量和细胞数组以外的细胞阵列的特征向量是不允许的。

    • 如果资源描述包含响应变量用于火车Mdl,那么你不需要指定ResponseVarNameY

    • 如果你训练Mdl使用样本数据包含在一个表中,然后输入数据边缘也必须在一个表中。

    • 如果你设置“标准化”,真的fitcnet当训练Mdl,那么软件标准化的数字列预测数据使用对应的均值和标准差。

    数据类型:

    响应变量名称,指定为一个变量的名字资源描述。如果资源描述包含响应变量用于火车Mdl,那么你不需要指定ResponseVarName

    如果您指定ResponseVarName,那么你必须指定它作为特征向量或字符串标量。例如,如果响应变量是存储为Tbl.Y,然后指定ResponseVarName作为“Y”。否则,软件将所有列资源描述,包括Tbl.Y预测因子。

    响应变量必须分类,字符,或字符串数组;一个逻辑或数值向量;或一个单元阵列的特征向量。如果响应变量是一个字符数组,数组的每个元素都必须对应一行。

    数据类型:字符|字符串

    指定的类标签,分类,特点,或字符串数组;逻辑或数值向量;或细胞的特征向量。

    • 的数据类型Y的数据类型必须相同吗Mdl.ClassNames(软件对字符串数组作为细胞阵列特征向量)。

    • 的不同的类Y必须是一个子集的Mdl.ClassNames

    • 如果Y每个元素是一个字符数组,那么必须对应一个数组的行。

    • 的长度Y必须等于观测的数量X资源描述

    数据类型:分类|字符|字符串|逻辑|||细胞

    预测数据,指定为一个数字矩阵。默认情况下,边缘假定每一行X对应于一个观察,每一列对应一个预测变量。

    请注意

    如果你东方预测矩阵,以便观察并指定对应列“ObservationsIn”、“列”,那么你可能会经历显著减少计算时间。

    的长度Y和观察的数量X必须是相等的。

    如果你设置“标准化”,真的fitcnet当训练Mdl,那么软件标准化的数字列预测数据使用对应的均值和标准差。

    数据类型:|

    名称-值参数

    指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

    R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

    例子:边缘(Mdl台,“响应”,“权重”,“W”)指定使用响应W表中的变量资源描述分别作为类标签和观察权重。

    预测数据观察维度,指定为“行”“列”

    请注意

    如果你东方预测矩阵,以便观察并指定对应列“ObservationsIn”、“列”,那么你可能会经历显著减少计算时间。你不能指定“ObservationsIn”、“列”预测数据表。

    数据类型:字符|字符串

    观察体重、指定为一个非负数字向量或一个变量的名字资源描述。软件中每个观察权重X资源描述与相应的价值权重。的长度权重必须等于观测的数量吗X资源描述

    如果您指定输入数据表资源描述,然后权重可以是一个变量的名字资源描述包含一个数字向量。在这种情况下,您必须指定权重作为一个特征向量或字符串标量。例如,如果权重向量W存储为Tbl.W,然后指定它' W '

    默认情况下,权重的(n, 1),在那里n观察的数量吗X资源描述

    如果你提供重量,那么边缘计算加权分类边缘和规范权重和先验概率的值在相应的类中。

    数据类型:||字符|字符串

    更多关于

    全部折叠

    分类的优势

    分类的优势的意思是分类的利润率的加权平均值分类的利润率当你指定权重

    选择在多个分类器的一种方式,例如进行特征选择,是选择收益最大的边缘的分类器。

    分类保证金

    分类保证金二进制分类,对每个观察,真正的类的分类得分之间的差异和分类评分错误类。的分类保证金多级分类的区别是真正的类的分类评分和虚假的最大分数类。

    如果相同规模的利润(即得分值是基于相同的分数转换),然后他们作为衡量分类信心。在多个分类器,那些产生更大的利润更好。

    版本历史

    介绍了R2021a

    全部展开