主要内容

RegressionTreeCoderConfigurer

用于回归的二叉决策树模型的编码器配置器

描述

一个RegressionTreeCoderConfigurer对象是回归二进制决策树模型的编码器配置程序(RegressionTreeCompactRegressionTree).

编码器配置器提供了方便的特性来配置代码生成选项、生成C/ c++代码以及更新生成代码中的模型参数。

  • 配置代码生成选项,并使用对象属性为树模型参数指定编码器属性。

  • 生成C/ c++代码预测更新利用回归树模型的函数generateCode.生成C/ c++代码需要MATLAB®编码员™

  • 更新生成的C/ c++代码中的模型参数,而不需要重新生成代码。当您使用新数据或设置重新训练树模型时,该特性减少了重新生成、重新部署和重新验证C/ c++代码所需的工作。在更新模型参数之前,请使用validatedUpdateInputs验证和提取要更新的模型参数。

此流程图显示了使用编码器配置器的代码生成工作流。

两个代码生成工作流:第一个在训练模型之后,第二个在重新训练相同的模型之后。第一个工作流,步骤1:创建一个编码器配置器。步骤2:生成代码。步骤3:验证生成的代码。第二个工作流,步骤1:检查更新是否有效。是= >步骤2;否,执行第一个工作流的第一步。步骤2:更新生成代码中的模型参数。

有关回归树模型的代码生成使用说明和限制,请参阅CompactRegressionTree预测,更新

创建

在使用fitrtree,使用以下方法为模型创建一个编码器配置器learnerCoderConfigurer.属性的编码器属性预测更新参数。然后,使用generateCode根据指定的编码器属性生成C/ c++代码。

特性

全部展开

预测参数

属性的编码器属性预测生成的代码中的函数参数。

Coder属性的预测器数据传递到生成的C/ c++代码预测回归树模型的函数,指定为学习者输入对象。

使用使用时创建编码器配置程序时learnerCoderConfigurer函数的输入参数X属性的默认值学习者输入编码器属性:

  • SizeVector-默认值是输入的数组大小X

  • 可变尺寸- 这个值是[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型- 这个值是单身的.默认数据类型取决于输入的数据类型X

  • 可调谐性—必须为真正的,这意味着预测在生成的C/C++代码中,始终包含预测器数据作为输入。

您可以使用点表示法修改编码器属性。例如,要生成接受带有三个预测变量的100个观察值的预测数据的C/ c++代码,指定这些编码器属性X对于编码器配置程序配置

configuration . x . sizevector = [100 3];configurer.X.DataType =“双人”;configurer.X.VariableDimensions = [0 0];
[0 0]指示的第一个和第二个维度X(观测数和预测变量数分别)有固定的大小。

要允许生成的C/ c++代码接受多达100个观测值的预测数据,请指定这些编码器属性X

configuration . x . sizevector = [100 3];configurer.X.DataType =“双人”;configurer.X.VariableDimensions = [1 0];
[1 0]表示第一维度X(观察的数量)有一个可变的大小和第二个维度X(预测器变量的数量)具有固定大小。在该示例中指定的观察数100,成为生成的C / C ++代码中的最大允许观察数。要允许任何数量的观察,请指定绑定

从生成的C / C ++代码返回的输出参数的数量预测回归树模型的功能,指定为1或2。

的输出参数预测伊菲特(预测的答复)和节点(预测的节点编号),按该顺序。预测在生成的C / C ++代码中返回第一个代码n输出的预测函数,nNumOutputs价值。

创建编码器配置程序后配置,可以使用点表示法指定输出的数量。

配置。NumOutputs= 2;

NumOutputs财产相当于“-纳古特”编译器选项的Codegen.(MATLAB编码器).此选项指定代码生成的入口函数中的输出参数的数量。的目标函数generateCode生成两个入口点函数predict.m更新..预测更新函数,分别生成两个入口点函数的C/C++代码NumOutputs属性对应于入口点函数中的输出参数数量predict.m

数据类型:

更新参数

属性的编码器属性更新生成的代码中的函数参数。的更新函数接受训练过的模型和新的模型参数作为输入参数,并返回包含新参数的模型的更新版本。要启用更新生成代码中的参数,您需要在生成代码之前指定参数的编码器属性。使用一个学习者输入对象指定每个参数的编码器属性。默认属性值基于输入参数中的模型参数MdllearnerCoderConfigurer

树中每个节点的子节点的编码器属性(儿童的回归树模型),指定为学习者输入对象。

属性的默认属性值学习者输入对象基于输入参数MdllearnerCoderConfigurer

  • SizeVector- 默认值是(2 nd),在那里nd是节点的数量Mdl

  • 可变尺寸- 这个值是[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型- 这个值是“单一”“双人”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为真正的

如果修改了的第一个尺寸标注SizeVector成为newnd,然后软件修改的第一个维度SizeVector属性newnd的属性割点cutpredictorindex.,NodeMean.同样,如果修改第一维度可变尺寸成为1,然后软件修改的第一个维度可变尺寸属性1对于这些属性。

树中每个节点的切割点的编码属性(割点的回归树模型),指定为学习者输入对象。

属性的默认属性值学习者输入对象基于输入参数MdllearnerCoderConfigurer

  • SizeVector- 默认值是[nd 1],在那里nd是节点的数量Mdl

  • 可变尺寸- 这个值是[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型- 这个值是“单一”“双人”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为真正的

如果修改了的第一个尺寸标注SizeVector成为newnd,然后软件修改的第一个维度SizeVector属性newnd的属性儿童cutpredictorindex.,NodeMean.同样,如果修改第一维度可变尺寸成为1,然后软件修改的第一个维度可变尺寸属性1对于这些属性。

树中每个节点的cut预测器索引的编码属性(cutpredictorindex.的回归树模型),指定为学习者输入对象。

属性的默认属性值学习者输入对象基于输入参数MdllearnerCoderConfigurer

  • SizeVector- 默认值是[nd 1],在那里nd是节点的数量Mdl

  • 可变尺寸- 这个值是[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型- 这个值是“单一”“双人”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为真正的

如果修改了的第一个尺寸标注SizeVector成为newnd,然后软件修改的第一个维度SizeVector属性newnd的属性儿童割点,NodeMean.同样,如果修改第一维度可变尺寸成为1,然后软件修改的第一个维度可变尺寸属性1对于这些属性。

树中每个节点的平均响应值的编码器属性(NodeMean的回归树模型),指定为学习者输入对象。

属性的默认属性值学习者输入对象基于输入参数MdllearnerCoderConfigurer

  • SizeVector- 默认值是[nd 1],在那里nd是节点的数量Mdl

  • 可变尺寸- 这个值是[0 0](默认)或[1 0]

    • [0 0]中指定的数组大小是固定的SizeVector

    • [1 0]指示数组具有可变大小的行和固定大小的列。在本例中,第一个值SizeVector上限值是行数,第二个值是SizeVector是列数。

  • 数据类型- 这个值是“单一”“双人”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为真正的

如果修改了的第一个尺寸标注SizeVector成为newnd,然后软件修改的第一个维度SizeVector属性newnd的属性儿童割点,cutpredictorindex..同样,如果修改第一维度可变尺寸成为1,然后软件修改的第一个维度可变尺寸属性1对于这些属性。

其他配置选项

生成的C/C++代码的文件名,指定为字符向量。

的目标函数generateCodeRegressionTreeCoderConfigurer使用此文件名生成C/C++代码。

文件名不能包含空格,因为在某些操作系统配置中,空格可能导致代码生成失败。此外,文件名必须是有效的MATLAB函数名。

创建编码器配置程序后配置,您可以使用点表示法指定文件名。

配置。OutputFileName =“myModel”

数据类型:字符

详细级别,指定为真正的(逻辑1)或错误的(逻辑0)。详细级别控制命令行中通知消息的显示。

价值 描述
真正的(逻辑1) 当您对参数的编码器属性的更改导致其他相关参数的更改时,软件显示通知消息。
错误的(逻辑0) 该软件不显示通知消息。

要在生成的代码中启用更新计算机学习模型参数,您需要在生成代码之前配置参数的编码器属性。参数的编码器属性彼此依赖,因此该软件将依赖项存储为配置约束。如果使用编码器配置器修改参数的编码器属性,并且修改需要后续更改对其他从属参数来满足配置约束,则软件改变了相关参数的编码器属性。冗长级别确定软件是否显示这些后续更改的通知消息。

创建编码器配置程序后配置,您可以使用点表示法修改详细程度。

configur.verbose = false;

数据类型:逻辑

代码生成自定义选项

要自定义代码生成工作流程,请使用generateFiles函数和下面三个属性Codegen.(MATLAB编码器),而不是使用generateCode作用

在生成两个入口点函数文件(predict.m更新..),使用generateFiles功能,您可以根据代码生成工作流修改这些文件。例如,您可以修改predict.m文件以包含数据预处理,或者可以将这些入口点函数添加到另一个代码生成项目中。然后,您可以通过使用Codegen.(MATLAB编码器)函数和Codegen.适用于修改的入口点函数或代码生成项目的参数。使用本节中描述的三个属性作为起点来设置Codegen.参数。

此属性是只读的。

Codegen.(MATLAB编码器)参数,指定为单元格数组。

此属性使您能够自定义代码生成工作流。使用generateCode函数,如果您不需要自定义您的工作流。

而不是使用generateCode使用编码器配置器配置,您可以生成C / C ++代码,如下所示:

generateFiles(配置器)cgArgs = configuration . codegenerationarguments;codegen (cgArgs {}):
如果您自定义代码生成工作流,请修改cgArgs因此之前调用Codegen.

修改的其他属性配置,软件更新CodeGenerationArguments.相应的属性。

数据类型:单间牢房

此属性是只读的。

入口点函数的输入参数predict.m对于代码生成,指定为一个单元格数组编码器。PrimitiveType(MATLAB编码器)对象。的编码器。PrimitiveType对象中存储的预测器数据的编码器属性X财产。

如果你修改了预测器数据的编码属性,那么软件就会更新编码器。PrimitiveType相应的对象。

编码器。PrimitiveType对象PredictInputs相当于configurer.codegenerationArguments {6}对于编码器配置程序配置

数据类型:单间牢房

此属性是只读的。

入口点函数的可调输入参数列表更新..对于代码生成,指定为结构的单元数组,包括编码器。PrimitiveType(MATLAB编码器)对象。每一个编码器。PrimitiveType对象包含可调机器学习模型参数的编码器属性。

如果您使用编码器配置器属性修改模型参数的编码器属性(更新参数属性),然后软件更新相应的编码器。PrimitiveType相应的对象。如果您指定了可调谐性机器学习模型参数的属性为错误的,则软件将删除相应的编码器。PrimitiveType来自杂志的对象UpdateInputs列表。

结构在UpdateInputs相当于配置。CodeGenerationArguments {3}对于编码器配置程序配置

数据类型:单间牢房

目标函数

generateCode 使用编码器配置器生成C/ c++代码
generateFiles 产生MATLAB使用编码器配置器生成代码的文件
validatedUpdateInputs 验证和提取机器学习模型参数以更新

例子

全部崩溃

训练一个机器学习模型,然后生成代码预测更新使用编码器配置器来函数模型。

加载CARBIG.包含汽车数据的数据集,并培训回归树模型。

负载CARBIG.X=[排量马力重量];Y=MPG;Mdl=Firtree(X,Y);

Mdl是A.RegressionTree对象。

控件创建一个编码器配置器RegressionTree利用learnerCoderConfigurer. 指定预测数据X.的learnerCoderConfigurer函数使用输入X要配置的编码器属性,请执行以下操作:预测函数输入。

CONFIGURER = LEARNERCODERCONFIGURER(MDL,X)
configurer = RegressionTreeCoderConfigurer with properties: Update Inputs: Children: [1x1 LearnerCoderInput] NodeMean: [1x1 LearnerCoderInput] CutPoint: [1x1 LearnerCoderInput] CutPredictorIndex: [1x1 LearnerCoderInput] Predict Inputs: X: [1x1 LearnerCoderInput] Code Generation Parameters: NumOutputs: 1 OutputFileName:“RegressionTreeModel”属性,方法

配置是A.RegressionTreeCoderConfigurer对象,它是一个编码器配置程序RegressionTree对象。

要生成C/ c++代码,您必须访问配置正确的C/ c++编译器。MATLAB编码器定位并使用一个受支持的、安装的编译器。金宝app您可以使用墨西哥人-设置查看和更改默认编译器。有关详细信息,请参见改变默认的编译器

预测更新回归树模型的功能(Mdl)的默认设置。

generatecode(Configurer)
GenerateCode在输出文件夹中创建这些文件:'Initialize.m','predict.m','update.m','reightoniontreemodel.mat'代码生成成功。

generateCode函数完成这些动作:

  • 生成MATLAB文件所需的生成代码,包括两个入口点函数predict.m更新..预测更新的功能Mdl,分别。

  • 创建一个名为RegressionTreeModel对于两个入口点函数。

  • 控件中创建MEX函数的代码codegen\mex\RegressionTreeModel文件夹。

  • 将MEX函数复制到当前文件夹。

显示文件的内容predict.m更新..,initialize.m通过使用类型作用

类型predict.m
function varargout = predict(X,varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:43:48 [varargout{1:nargout}] = initialize('predict',X,varargin{:});结束
类型更新..
function update(varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:43:48 initialize('update',varargin{:});结束
类型initialize.m
函数[varargout]=initialize(command,varargin)%#codegen%由MATLAB自动生成,2021年9月1日14:43:48 coder.inline('always')持久模型如果isempty(model)model=loadLearnerForCoder('RegressionTreeModel.mat');end开关(command)case“update”%update struct fields:Children%NodeMean%cutpredictIndex model=update(model,varargin{:});case'predict'%predict Inputs:X X=varargin{1};if-nargin==2[varargout{1:nargout}]=predict(model,X);else-PVPairs=cell(1,nargin-2);对于i=1:nargin-2 PVPairs{1,i}=varargin{i+1};end[varargout{1:nargout}]=predict(model,X,PVPairs{:});end-end-end-end-end

使用部分数据集训练回归树,并为模型创建编码器配置器。使用编码器配置器的属性指定模型参数的编码器属性。使用编码器配置器的目标函数生成预测新预测数据响应的C代码。然后使用整个数据重新训练模型在生成的代码中设置和更新参数,而不重新生成代码。

火车模型

加载CARBIG.数据集,并训练回归树模型使用一半的观察。

负载CARBIG.X=[排量马力重量];Y=MPG;rng(“默认”%的再现性n =长度(Y);idxTrain = randsample (n, n / 2);XTrain = X (idxTrain:);YTrain = Y (idxTrain);Mdl = fitrtree (XTrain YTrain);

Mdl是A.RegressionTree对象。

创建编码器配置

控件创建一个编码器配置器RegressionTree利用learnerCoderConfigurer. 指定预测数据XTrain..的learnerCoderConfigurer函数使用输入XTrain.要配置的编码器属性,请执行以下操作:预测函数输入。此外,将输出的数量设置为2,以便生成的代码返回预测的预测响应和节点号。

配置= learnerCoderConfigurer (Mdl XTrain,“NumOutputs”,2);

配置是A.RegressionTreeCoderConfigurer对象,它是一个编码器配置程序RegressionTree对象。

指定参数的编码器属性

指定回归树模型参数的编码器属性,以便您可以在重新训练模型后更新生成代码中的参数。

属性的编码器属性X性质配置以便生成的代码接受任意数量的观察SizeVector可变尺寸属性。的SizeVector属性指定预测器数据大小的上限,以及可变尺寸属性指定预测器数据的每个维度是具有可变大小还是固定大小。

configurer.X.SizeVector=[Inf 3];configurer.X.VariableDimensions
ans=1 x2逻辑阵列1 0

第一个维度的大小是观察数。设置SizeVector把某事归因于某人导致软件修改可变尺寸把某事归因于某人1.换句话说,大小的上限为并且大小是可变的,这意味着预测器数据可以具有任何数量的观察。如果您不知道生成代码时的观察次数,则此规范很方便。

第二个维度的大小是预测器变量的数量。对于机器学习模型,此值必须固定。因为预测器数据包含3个预测器,所以SizeVector属性必须3.以及可变尺寸属性必须0

如果使用新的数据或不同的设置重新训练树模型,树中的节点数量可能会有所不同。因此,指定的第一个维度SizeVector属性,以便更新生成的代码中的节点数量:儿童割点cutpredictorindex., 或者NodeMean.然后软件会自动修改其他属性。

的第一个值SizeVector属性的NodeMean财产.软件修改SizeVector可变尺寸属性儿童割点,cutpredictorindex.以匹配树中节点数目的新上限。的第一个值可变尺寸属性NodeMean更改1

configur.nodemean.sizevector = [INF 1];
修改了Children的sizeevector属性以满足配置约束。CutPoint的SizeVector属性已被修改以满足配置约束。CutPredictorIndex的SizeVector属性已被修改以满足配置约束。已修改Children的VariableDimensions属性以满足配置约束。已修改CutPoint的VariableDimensions属性以满足配置约束。已修改CutPredictorIndex的VariableDimensions属性以满足配置约束。
configurer.NodeMean.VariableDimensions
ans=1 x2逻辑阵列1 0

生成代码

要生成C/ c++代码,您必须访问配置正确的C/ c++编译器。MATLAB编码器定位并使用一个受支持的、安装的编译器。金宝app您可以使用墨西哥人-设置查看和更改默认编译器。有关详细信息,请参见改变默认的编译器

预测更新回归树模型的功能(Mdl).

generatecode(Configurer)
GenerateCode在输出文件夹中创建这些文件:'Initialize.m','predict.m','update.m','reightoniontreemodel.mat'代码生成成功。

generateCode函数完成这些动作:

  • 生成MATLAB文件所需的生成代码,包括两个入口点函数predict.m更新..预测更新的功能Mdl,分别。

  • 创建一个名为RegressionTreeModel对于两个入口点函数。

  • 控件中创建MEX函数的代码codegen\mex\RegressionTreeModel文件夹。

  • 将MEX函数复制到当前文件夹。

验证生成的代码

传递一些预测数据以验证预测功能Mdl预测MEX函数中的函数返回相同的预测响应。要在具有多个入口点的MEX函数中调用一个入门点函数,请将函数名称指定为第一个输入参数。

[Yfit,node]=预测(Mdl,XTrain);[Yfit\u-mex,node\u-mex]=回归树模型(“预测”,XTrain);

比较伊菲特Yfit_mex节点node_-mex

马克斯(abs (Yfit-Yfit_mex), [],“全部”
ans = 0.
node_mex isequal(节点)
ans=逻辑1

一般来说,Yfit_mex可能包括舍入差异与伊菲特. 在这种情况下,比较证实了伊菲特Yfit_mex是相等的。

isequal返回逻辑1 (真正的),如果所有输入参数相等。比较证实了预测功能Mdl预测MEX函数中的函数返回相同的节点号。

在生成的代码中重新训练模型和更新参数

使用整个数据集重新训练模型。

retrainedMdl = fitrtree (X, Y);

使用提取要更新的参数validatedUpdateInputs。此功能检测中修改的模型参数再培训DMDL并验证修改后的参数值是否满足参数的编码器属性。

params = validatedUpdateInputs(配置、retrainedMdl);

更新生成代码中的参数。

RegressionTreeModel (“更新”,params)

验证生成的代码

的输出参数比较预测功能再培训DMDL预测函数。

[Yfit、节点]=预测(retrainedMdl X);[Yfit_mex, node_mex] = RegressionTreeModel (“预测”, X);马克斯(abs (Yfit-Yfit_mex), [],“全部”
ans = 0.
node_mex isequal(节点)
ans=逻辑1

比较确认预测响应和节点数相等。

更多关于

全部展开

介绍了R2019b