主要内容

ClassificationTreeCoderConfigurer

用于多类分类的二叉决策树模型的编码器配置器

描述

一个ClassificationTreeCoderConfigurer对象是用于多类分类的二叉决策树模型的编码器配置器(ClassificationTree紧分类树).

编码器配置器提供了方便的特性来配置代码生成选项、生成C/ c++代码以及更新生成代码中的模型参数。

  • 配置代码生成选项,并使用对象属性指定树模型参数的编码器属性。

  • 生成C/ c++代码预测更新利用分类树模型的功能generateCode.生成C/ c++代码需要MATLAB®编码器™

  • 更新生成的C/ c++代码中的模型参数,而不需要重新生成代码。当您使用新数据或设置重新训练树模型时,该特性减少了重新生成、重新部署和重新验证C/ c++代码所需的工作。在更新模型参数之前,请使用验证更新输入验证并提取要更新的模型参数。

此流程图显示了使用编码器配置器的代码生成工作流。

两个代码生成工作流:第一个是在培训模型后生成的,第二个是在重新培训同一模型后生成的。第一个工作流,步骤1:创建编码器配置器。步骤2:生成代码。步骤3:验证生成的代码。第二个工作流,步骤1:检查更新是否有效。如果是,请转至步骤2;如果否,请转至第一个工作流的第一步。步骤2:更新生成代码中的模型参数。

有关分类树模型的代码生成使用说明和限制,请参阅紧分类树预测更新

创建

通过使用fitctree,使用以下方法为模型创建一个编码器配置器learnerCoderConfigurer.属性的编码器属性预测更新参数。然后,用generateCode根据指定的编码器属性生成C/ c++代码。

属性

全部展开

预测参数

属性的编码器属性预测生成的代码中的函数参数。

Coder属性的预测器数据传递到生成的C/ c++代码预测功能的分类树模型,指定为LearnerCoderInput对象。

使用创建编码器配置器时learnerCoderConfigurer函数,输入参数X属性的默认值LearnerCoderInput编码器属性:

  • SizeVector—默认值为输入的数组大小X

  • VariableDimensions—取值为[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型—取值为仅有一个的。默认数据类型取决于输入的数据类型X

  • 可调谐性—必须为符合事实的,意思是预测在生成的C/ c++代码中总是包含预测器数据作为输入。

您可以使用点表示法修改编码器属性。例如,要生成接受带有三个预测变量的100个观察值的预测数据的C/ c++代码,指定这些编码器属性X用于编码器配置器配置

configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configurer.X.VariableDimensions=[0];
[0 0]表示的第一个和第二个维度X(观察数和预测变量数分别)具有固定大小。

要允许生成的C/C++代码接受最多100个观测值的预测器数据,请指定X

configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configurer.X.VariableDimensions = [1 0];
[1 0]表示的第一个维度X(观察次数)具有可变大小和X(预测变量的数量)具有固定的大小。指定的观察数量(本例中为100)将成为生成的C/C++代码中允许的最大观察数量。若要允许任意数量的观察,请将边界指定为

要从生成的C/C++代码返回的输出参数数预测分类树模型的功能,指定为1、2、3或4。

的输出参数预测标签(预测类标签),分数(后验概率),节点(预测类的节点号),以及cnum(预测标签的类数),按此顺序。预测在生成的C/C++代码中,返回第一个n输出的预测功能,在哪里nNumOutputs价值

在创建编码器配置器之后配置,您可以使用点表示法指定输出的数量。

配置。NumOutputs= 2;

NumOutputs属性等价于“-nargout”编译器选项编码基因(MATLAB编码器).此选项指定代码生成的入口点函数中的输出参数数量。的目标函数generateCode生成两个入口点函数predict.m更新.m预测更新并为这两个入口点函数生成C/ c++代码。的指定值NumOutputs属性对应于入口点函数中的输出参数数量predict.m

数据类型:

更新参数

属性的编码器属性更新生成的代码中的函数参数更新函数接受训练过的模型和新的模型参数作为输入参数,并返回包含新参数的模型的更新版本。要启用更新生成代码中的参数,您需要在生成代码之前指定参数的编码器属性。使用一个LearnerCoderInput对象指定每个参数的编码器属性。默认属性值基于输入参数中的模型参数Mdl属于learnerCoderConfigurer

树中每个节点的子节点的编码器属性(孩子们的分类树模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于learnerCoderConfigurer

  • SizeVector—默认值为(2 nd),在那里节点数在吗Mdl

  • VariableDimensions—取值为[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型—取值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为符合事实的

如果你修改SizeVectornewnd,然后软件修改的第一个维度SizeVector属性为newnd对于属性ClassProbability割点CutPredictorIndex.类似地,如果你修改VariableDimensions1,然后软件修改的第一个维度VariableDimensions属性为1这些属性。

树中每个节点的类概率的编码器属性(ClassProbability的分类树模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于learnerCoderConfigurer

  • SizeVector—默认值为[nd c],在那里节点数在吗Mdlc为类数。

  • VariableDimensions—取值为[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型—取值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为符合事实的

如果你修改SizeVectornewnd,然后软件修改的第一个维度SizeVector属性为newnd对于属性孩子们割点CutPredictorIndex.类似地,如果你修改VariableDimensions1,然后软件修改的第一个维度VariableDimensions属性为1这些属性。

错误分类成本的编码者属性(成本的分类树模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于learnerCoderConfigurer

  • SizeVector—必须为(c c),在那里c为类数。

  • VariableDimensions—必须为[0 0],表示数组大小是固定的,如SizeVector

  • 数据类型—取值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—默认值为符合事实的

树中每个节点的切割点的编码属性(割点的分类树模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于learnerCoderConfigurer

  • SizeVector—默认值为(nd - 1),在那里节点数在吗Mdl

  • VariableDimensions—取值为[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型—取值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为符合事实的

如果你修改SizeVectornewnd,然后软件修改的第一个维度SizeVector属性为newnd对于属性孩子们ClassProbabilityCutPredictorIndex.类似地,如果你修改VariableDimensions1,然后软件修改的第一个维度VariableDimensions属性为1这些属性。

树中每个节点的切割预测器索引的编码器属性(CutPredictorIndex的分类树模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于learnerCoderConfigurer

  • SizeVector—默认值为(nd - 1),在那里节点数在吗Mdl

  • VariableDimensions—取值为[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型—取值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为符合事实的

如果你修改SizeVectornewnd,然后软件修改的第一个维度SizeVector属性为newnd对于属性孩子们ClassProbability割点.类似地,如果你修改VariableDimensions1,然后软件修改的第一个维度VariableDimensions属性为1这些属性。

先验概率的编码属性(先前的的分类树模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于learnerCoderConfigurer

  • SizeVector—必须为(1 c),在那里c为类数。

  • VariableDimensions—必须为[0 0],表示数组大小是固定的,如SizeVector

  • 数据类型—取值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—默认值为符合事实的

其他配置选项

生成的C/ c++代码的文件名,指定为字符向量。

的目标函数generateCode属于ClassificationTreeCoderConfigurer使用此文件名生成C/ c++代码。

文件名不能包含空格,因为在某些操作系统配置中,空格可能导致代码生成失败。此外,名称必须是有效的MATLAB函数名。

在创建编码器配置器之后配置,可以使用点表示法指定文件名。

configurer.OutputFileName=“myModel”

数据类型:字符

详细级别,指定为符合事实的(逻辑1)或(逻辑0)。详细级别控制命令行中通知消息的显示。

价值 描述
符合事实的(逻辑1) 当您对参数的编码器属性的更改导致其他相关参数的更改时,该软件将显示通知消息。
(逻辑0) 软件不显示通知消息。

要在生成的代码中启用更新机器学习模型参数,需要在生成代码之前配置参数的编码器属性。参数的编码属性彼此依赖,因此软件将依赖关系存储为配置约束。如果您使用编码器配置器修改参数的编码器属性,并且该修改需要随后更改其他相关参数以满足配置约束,则软件将更改相关参数的编码器属性。详细级别决定软件是否为这些后续更改显示通知消息。

在创建编码器配置器之后配置,您可以使用点表示法修改详细程度。

配置。详细的= false;

数据类型:逻辑

代码生成自定义选项

要自定义代码生成工作流,请使用generateFiles函数和下面三个属性编码基因(MATLAB编码器),而不是使用generateCode函数。

在生成两个入口点函数文件(predict.m更新.m)通过使用generateFiles函数,您可以根据代码生成工作流修改这些文件。例如,可以修改predict.m文件以包含数据预处理,或者可以将这些入口点函数添加到另一个代码生成项目中。然后,您可以通过使用编码基因(MATLAB编码器)功能与功能编码基因适合于修改的入口点函数或代码生成项目的参数。使用本节中描述的三个属性作为起点来设置编码基因参数。

此属性是只读的。

编码基因(MATLAB编码器)参数,指定为单元格数组。

此属性使您能够自定义代码生成工作流。使用generateCode如果不需要自定义工作流,则可以使用此函数。

而不是使用generateCode使用编码器配置器配置,你可以生成C/ c++代码如下:

generateFiles(配置器)cgArgs = configuration . codegenerationarguments;codegen (cgArgs {}):
如果自定义代码生成工作流,请修改cgArgs在打电话之前编码基因

修改的其他属性配置,则软件更新共生成元相应的属性。

数据类型:细胞

此属性是只读的。

入口点函数的输入参数predict.m对于代码生成,指定为单元格数组编码器。PrimitiveType(MATLAB编码器)对象。的编码器。PrimitiveType对象中存储的预测器数据的编码器属性X财产。

如果你修改了预测器数据的编码属性,那么软件就会更新编码器。PrimitiveType相应的对象。

编码器。PrimitiveType对象PredictInputs相当于configurer.CodeGeneratorGuments{6}用于编码器配置器配置

数据类型:细胞

此属性是只读的。

入口点函数的可调输入参数列表更新.m对于代码生成,指定为包含的结构的单元格数组编码器。PrimitiveType(MATLAB编码器)对象。每一个编码器。PrimitiveType对象包含可调机器学习模型参数的编码器属性。

如果您使用编码器配置器属性修改模型参数的编码器属性(更新参数属性),然后软件更新相应的编码器。PrimitiveType相应的对象。如果指定可调谐性机器学习模型参数的属性为,则软件删除相应的编码器。PrimitiveType对象的UpdateInputs列表。

的结构UpdateInputs相当于配置。CodeGenerationArguments {3}用于编码器配置器配置

数据类型:细胞

对象的功能

generateCode 使用编码器配置器生成C/ c++代码
generateFiles 生成MATLAB使用编码器配置器生成代码的文件
验证更新输入 验证并提取机器学习模型参数以进行更新

例子

全部折叠

训练一个机器学习模型,然后生成代码预测更新通过使用编码器配置器来实现模型的功能。

加载fisheriris包含花卉数据的数据集,并训练决策树模型。

负载fisheririsX =量;Y =物种;Mdl = fitctree (X, Y);

Mdl是一个ClassificationTree对象。

控件创建一个编码器配置器ClassificationTree模型通过使用learnerCoderConfigurer.指定预测器数据X.的learnerCoderConfigurer函数使用输入X属性的编码器属性预测函数的输入。

X配置= learnerCoderConfigurer (Mdl)
configurer = ClassificationTreeCoderConfigurer with properties: Update Inputs: Children: [1x1 LearnerCoderInput] ClassProbability: [1x1 LearnerCoderInput] CutPoint: [1x1 LearnerCoderInput] CutPredictorIndex: [1x1 LearnerCoderInput] Prior: [1x1 LearnerCoderInput] Cost: [1x1 LearnerCoderInput] Predict Inputs: X:[1x1 LearnerCoderInput]代码生成参数:NumOutputs: 1 OutputFileName: 'ClassificationTreeModel'属性,方法

配置是一个ClassificationTreeCoderConfigurer对象的编码配置器ClassificationTree对象。

要生成C/C++代码,您必须能够访问正确配置的C/C++编译器。MATLAB编码器定位并使用受支持的、已安装的编译器。你可以用金宝app墨西哥设置查看和更改默认编译器。有关详细信息,请参见更改默认编译器

预测更新分类树模型的功能(Mdl)的默认设置。

生成代码(配置器)
generateCode在输出文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“ClassificationTreeModel。代码生成成功。

generateCode函数完成这些动作:

  • 生成MATLAB文件所需的生成代码,包括两个入口点函数predict.m更新.m预测更新的功能Mdl,分别。

  • 创建一个名为ClassificationTreeModel对于两个入口点函数。

  • 控件中创建MEX函数的代码codegen\mex\ClassificationTreeModel文件夹中。

  • 将MEX函数复制到当前文件夹。

显示的内容predict.m更新.m初始化.m文件,使用类型函数。

类型predict.m
function varargout = predict(X,varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:42:11 [varargout{1:nargout}] = initialize('predict',X,varargin{:});结束
类型更新.m
function update(varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:42:11 initialize('update',varargin{:});结束
类型初始化.m
function [varargout] = initialize(command,varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:42:11 code .inline('always') persistent model if isempty(model) model = loadLearnerForCoder(' classificationtremodel .mat');end switch(command) case 'update' % update struct fields: Children % ClassProbability % CutPoint % CutPredictorIndex % Prior % Cost model = update(model,varargin{:});case 'predict' %预测输入:X X = varargin{1};if nargout == 2 [varargout{1:nargout}] = predict(model,X);else PVPairs = cell(1,nargin-2);for i = 1:nargin-2 PVPairs{1,i} = varargin{i+1};end [varargout{1:nargout}] = predict(model,X,PVPairs{:});结束结束结束

使用部分数据集训练决策树进行多类分类,并为模型创建编码器配置器。使用编码器配置器的属性来指定模型参数的编码器属性。使用编码器配置器的对象函数生成C代码,用于预测新的预测数据的标签。然后使用整个数据集重新训练模型,并在不重新生成代码的情况下更新生成代码中的参数。

列车模型

加载fisheriris包含花朵数据的数据集。此数据集有四个预测因子:花朵的萼片长度、萼片宽度、花瓣长度和花瓣宽度。响应变量包含花朵物种名称:刚毛、花色和弗吉尼亚。使用一半的观察值训练分类树模型。

负载fisheririsX =量;Y =物种;rng (“默认”%的再现性n=长度(Y);c=分区(Y,“坚持”, 0.5);idxTrain =培训(c, 1);XTrain = X (idxTrain:);YTrain = Y (idxTrain);Mdl = fitctree (XTrain YTrain);

Mdl是一个ClassificationTree对象。

创建编码器配置

控件创建一个编码器配置器ClassificationTree模型通过使用learnerCoderConfigurer.指定预测器数据。的learnerCoderConfigurer函数使用输入XTrain属性的编码器属性预测函数输入。另外,将输出数设置为4,以便生成的代码返回预测的标签、分数、节点号和类号。

配置= learnerCoderConfigurer (Mdl XTrain,“NumOutputs”4);

配置是一个ClassificationTreeCoderConfigurer对象的编码配置器ClassificationTree对象。

指定参数的编码器属性

指定分类树模型参数的编码器属性,以便可以在重新训练模型后更新生成代码中的参数。

对象的编码器属性X的属性配置这样生成的代码就可以接受任意数量的观察。修改SizeVectorVariableDimensions属性。的SizeVector属性指定预测器数据大小的上限,而VariableDimensions属性指定预测器数据的每个维度是具有可变大小还是固定大小。

[Inf 4];configurer.X.VariableDimensions
ans =1x2逻辑阵列1 0

第一个维度的大小是观测的次数。的值SizeVector属性来使软件更改VariableDimensions属性来1.换句话说,大小的上限是它的大小是可变的,这意味着预测数据可以有任意数量的观测数据。如果您在生成代码时不知道观察的数量,那么这个规范很方便。

第二个维度的大小是预测器变量的数量。对于机器学习模型,此值必须固定。因为预测器数据包含4个预测器,所以SizeVector属性必须是4以及它的价值VariableDimensions属性必须是0

如果使用新数据或不同设置重新训练树模型,则树中的节点数可能会有所不同。因此,请指定树的第一个维度SizeVector属性,以便您可以更新生成代码中的节点数:孩子们ClassProbability割点CutPredictorIndex.然后软件会自动修改其他属性。

的第一个值SizeVector的属性割点财产.软件修改SizeVectorVariableDimensions的属性孩子们ClassProbabilityCutPredictorIndex以匹配树中节点数目的新上限。的第一个值VariableDimensions的属性割点更改1

configuration . cutpoint . sizevector = [Inf 1];
修改了Children的sizeevector属性以满足配置约束。CutPredictorIndex的SizeVector属性已被修改以满足配置约束。已修改Children的VariableDimensions属性以满足配置约束。已修改CutPredictorIndex的VariableDimensions属性以满足配置约束。ClassProbability的SizeVector属性已被修改以满足配置约束。ClassProbability的VariableDimensions属性已被修改以满足配置约束。
configurer.CutPoint.VariableDimensions
ans =1x2逻辑阵列1 0

生成代码

要生成C/C++代码,您必须能够访问正确配置的C/C++编译器。MATLAB编码器定位并使用受支持的、已安装的编译器。你可以用金宝app墨西哥设置查看和更改默认编译器。有关详细信息,请参见更改默认编译器

预测更新分类树模型的功能(Mdl).

生成代码(配置器)
generateCode在输出文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“ClassificationTreeModel。代码生成成功。

generateCode函数完成这些动作:

  • 生成MATLAB文件所需的生成代码,包括两个入口点函数predict.m更新.m预测更新的功能Mdl,分别。

  • 创建一个名为ClassificationTreeModel对于两个入口点函数。

  • 控件中创建MEX函数的代码codegen\mex\ClassificationTreeModel文件夹中。

  • 将MEX函数复制到当前文件夹。

验证生成的代码

通过一些预测数据来验证是否预测的函数Mdl预测函数中的函数返回相同的输出参数。要在具有多个入口点的MEX函数中调用入口点函数,请将函数名指定为第一个输入参数。

[标签,分数、节点cnum] =预测(Mdl XTrain);[label_mex, score_mex node_mex cnum_mex] = ClassificationTreeModel (“预测”, XTrain);

比较标签标签通过使用isequal.同样的,比较节点node_mexcnumcnum_mex

label_mex isequal(标签)
ans =逻辑1
node_mex isequal(节点)
ans =逻辑1
isequal (cnum cnum_mex)
ans =逻辑1

isequal返回逻辑1 (符合事实的),如果所有输入参数相等。比较证实了预测的函数Mdl预测MEX函数中的函数返回相同的标签、节点号和类号。

比较分数score_mex

马克斯(abs (score-score_mex), [],“所有”
ans = 0

一般来说,score_mex可能包括舍入差异与分数.在本例中,比较证实了这一点分数score_mex是相等的。

在生成的代码中重新训练模型和更新参数

使用整个数据集重新训练模型。

retrainedMdl = fitctree (X, Y);

使用提取要更新的参数验证更新输入.该函数检测修改后的模型参数retrainedMdl并验证修改后的参数值是否满足参数的编码器属性。

params = validatedUpdateInputs(配置、retrainedMdl);

更新生成代码中的参数。

分类树模型(“更新”params)

验证生成的代码

的输出参数比较预测的函数retrainedMdl预测函数。

[label,score,node,cnum]=预测(retainedmdl,X);[label_-mex,score_-mex,node_-mex,cnum_-mex]=分类树模型(“预测”, X);label_mex isequal(标签)
ans =逻辑1
node_mex isequal(节点)
ans =逻辑1
isequal (cnum cnum_mex)
ans =逻辑1
马克斯(abs (score-score_mex), [],“所有”
ans = 0

通过比较可以确认标签、节点号、类号和分数是相等的。

更多关于

全部展开

介绍了R2019b