石灰

局部可解释模型不可知解释（LIME）

全部展开页面

描述

石灰通过查找重要的预测值并拟合简单的可解释模型，解释对查询点的机器学习模型（分类或回归）的预测。

您可以创建石灰对象与指定的查询点机器学习模型（查询点）和指定数量的重要预测（numImportantPredictors). 该软件生成一个合成数据集，并适合重要预测值的简单可解释模型，该模型可有效解释查询点周围合成数据的预测。简单模型可以是线性模型（默认）或决策树模型。

使用拟合的简单模型在指定的查询点处本地解释本地机器学习模型的预测。使用情节函数可视化LIME结果。根据局部的解释，你可以决定是否相信机器学习模型。

将新的简单模型用于另一个查询点适合函数。

创建

语法

结果=石灰（黑盒）

结果=石灰（黑盒，X）

结果=石灰(黑箱,CustomSyntheticData, CustomSyntheticData)

结果=石灰(___， 'QueryPoint'，queryPoint， 'NumImportantPredictors'，numImportantPredictors）

结果=石灰(___、名称、值)

描述

例子

结果=石灰（黑盒子）创造一个石灰反对使用机器学习模型对象黑盒子包含预测数据。这石灰函数生成合成预测数据集的样本，并计算样本的预测。要适合简单模型，请使用适合功能结果．

例子

结果=石灰（黑盒子那X）创造一个石灰对象中使用的预测器数据X．

结果=石灰（黑盒子'CustomSyntheticData'，customSyntheticData）创造一个石灰对象，使用预生成的自定义合成预测器数据集customSyntheticData. 这个石灰函数计算中样本的预测customSyntheticData．

例子

结果=石灰（___“QueryPoint”,查询点“NumImportantPredictors”,numImportantPredictors）还发现的重要预测指定数量和适合的查询点的线性简单的模型查询点. 您可以指定查询点和numImportantPredictors除了前面语法中的任何输入参数组合之外。

结果=石灰（___那名称，价值）使用一个或多个名称-值对参数指定其他选项。例如,“SimpleModelType”、“树”指定简单模型的类型为决策树模型。

输入参数

全部展开

`黑盒子`-需要解释的机器学习模型
回归模型对象|分类模型对象|功能手柄

要解释的机器学习模型，指定为函数句柄或完整或紧凑的回归或分类模型对象。

函数句柄——可以指定一个函数句柄，该函数句柄接受预测器数据，并为预测器数据中的每个观测返回一个预测。您必须提供预测数据使用X或customSyntheticData并指定“类型”名称值对参数。

完整或紧凑的模型对象-可以指定完整或紧凑的回归或分类模型对象，该对象具有预测对象功能。该软件使用预测函数来计算查询点的预测和合成预测器数据集。

回归模型对象

金宝app支持模型	全部或紧凑型回归模型对象
回归模型集合	`回归套`那`RegressionBaggedEnsemble`那`CompactRegressionEnsemble`
高斯核回归模型采用随机特征展开	`回归科内尔`
高斯过程回归	`回归方程`那`CompactRegressionGP`
线性回归用于高维数据	`RegressionLinear`
回归树	`RegressionTree`那`Compactregressiontree.`
金宝app支持向量机回归	`RegressionSVM`那`CompactRegressionSVM`

分类模型对象

金宝app支持模型	完整或紧凑分类模型对象
判别分析分类	`ClassificationDiscriminant`那`CompactClassificationDiscriminant`
支持向量机或其他分类器的多类模型金宝app	`分类`那`紧凑分类`
乐团为学习者分类	`ClassificationEnsemble`那`CompactClassificationEnsemble`那`ClassificationBaggedEnsemble`
基于随机特征展开的高斯核分类模型	`ClassificationKernel`
K.最近的邻居分类器	`ClassificationKNN`
线性分类模型	`ClassificationLinear`
多类朴素贝叶斯模型	`ClassificationNaiveBayes`那`CompactClassificationNaiveBayes`
金宝app支持向量机分类为一类和二元分类	`ClassificationSVM`那`CompactClassificationSVM`
用于多类分类的二叉决策树	`分类树`那`CompactClassificationTree`

如果指定了一个紧凑的模型对象，它不包含预测数据，则必须使用提供的预测数据X或customSyntheticData．
石灰不支持使用稀疏矩阵金宝app训练的模型对象。训练模型时，使用完整的数值矩阵或表格作为预测数据，其中行对应于单个观测值。

`X`-预测数据
数字矩阵|桌子

预测数据，指定为数字矩阵或表。每一排X对应一个观察值，每一列对应一个变量。

X必须与预测数据一致的培训黑盒子，存储在一个blackbox.X或黑盒变量. 这个S.P.ecified value must not contain a response variable.

X必须具有与预测变量相同的数据类型(例如，trainX）训练有素黑盒子. 这个variables that make up the columns ofX必须有相同的数字和顺序trainX．
- 如果你训练黑盒子然后使用数字矩阵X必须是一个数值矩阵。
- 如果你训练黑盒子那就用表格吧X必须是一个表。所有的预测变量中X必须具有与中相同的变量名和数据类型trainX．
石灰不支持稀疏矩阵。金宝app

如果黑盒子是一个紧凑的机器学习模型对象或功能手柄，您必须提供X或customSyntheticData．如果黑盒子是一个完整的机器学习模型对象，并指定此参数，然后石灰不使用中的预测数据黑盒子．它只使用指定的预测器数据。

数据类型：单|双倍的

`customSyntheticData`-预先生成的，定制合成的预测数据集
`［］`(默认)|数字矩阵|桌子

预先生成的、自定义的合成预测器数据集，指定为数字矩阵或表。

如果提供预生成的数据集，则石灰使用提供的数据集而不是生成新的合成预测器数据集。

customSyntheticData必须与预测数据一致的培训黑盒子，存储在一个blackbox.X或黑盒变量. 这个S.P.ecified value must not contain a response variable.

customSyntheticData必须具有与预测变量相同的数据类型(例如，trainX）训练有素黑盒子. 这个variables that make up the columns ofcustomSyntheticData必须有相同的数字和顺序trainX
- 如果你训练黑盒子然后使用数字矩阵customSyntheticData必须是一个数值矩阵。
- 如果你训练黑盒子那就用表格吧customSyntheticData必须是一个表。所有的预测变量中customSyntheticData必须具有与中相同的变量名和数据类型trainX．
石灰不支持稀疏矩阵。金宝app

如果黑盒子是一个紧凑的机器学习模型对象或功能手柄，您必须提供X或customSyntheticData．如果黑盒子是一个完整的机器学习模型对象，并指定此参数，然后石灰不使用中的预测数据黑盒子；它只使用指定的预测器数据。

数据类型：单|双倍的|桌子

`查询点`-查询点
数值的行向量|单列表

查询点石灰解释了预测，指定为数字值的行向量或单行表中。查询点必须有相同的数据类型和列数X那customSyntheticData，或中的预测数据黑盒子．

如果您指定numImportantPredictors和查询点，那么石灰函数在创建模型时适用于简单模型石灰对象。

例子:: blackbox.X (1)指定查询点的预测数据的全部机器学习模型中的第一观察黑盒子．

数据类型：单|双倍的|桌子

`numImportantPredictors`-简单模型中使用的重要预测值的数量
正整数标量值

在简单模型中使用的重要预测数，指定为正整数标量值。

如果'simplemodeltype'是“线性”，那么软件选择的重要预测和配合所选择的预测器的线性模型指定的数量。
如果'simplemodeltype'是'树'，然后软件指定决策拆分（或分支节点）的最大数量作为重要预测器的数量，以便拟合的决策树最多使用指定数量的预测器。

如果您指定numImportantPredictors和查询点，那么石灰函数在创建模型时适用于简单模型石灰对象。

数据类型：单|双倍的

名称值对参数

指定可选的逗号分离对名称，价值论据。的名字是参数名和价值为对应值。的名字必须出现在引号内。您可以按任意顺序指定多个名称和值对参数，如下所示：名称1，值1，…，名称，值．

例子:石灰（黑盒子那'QueryPoint'，Q，“NumImportantPredictors”，n，'simpleModeltype'，'树'）将查询点指定为问：，使用很简单模型的重要预测数N和简单的模型决策树模型的类型。石灰产生合成的预测数据集的样品，计算用于样本预测，以及适合用于使用至多预测的指定数目的查询点决策树模型。

合成预测数据的选项

全部展开

`'datalocality'`-用于数据生成的合成数据的局部性
`“全球”`(默认)|`'当地的'`

用于数据生成的合成数据的位置，指定为由逗号分隔的对组成'datalocality'和“全球”或'当地的'．

“全球”-软件使用整个预测器数据集估计分布参数(X或者是预测数据黑盒子）.该软件利用估计的参数生成一个综合预测数据集，并使用该数据集对任何查询点进行简单的模型拟合。
'当地的'- 软件估计使用分布参数K.-查询点的最近邻，其中K.是“NumNeighbors”价值。该软件在每次适合指定查询点时都会生成新的合成预测器数据集。

有关更多详细信息，请参阅石灰．

例子:“数据位置”，“本地”

数据类型：字符|细绳

`“NumNeighbors”`-查询点的邻居数
1500(默认)|正整数标量值

查询点的邻居数，由逗号分隔的对组成“NumNeighbors”和一个正整数标量值。此参数仅在以下情况下有效'datalocality'是'当地的'．

如果指定的值大于预测器数据集中的观察数(X或者是预测数据黑盒子），然后石灰使用所有观察结果。

例子:“NumNeighbors”,2000年

数据类型：单|双倍的

`'NumSyntheticData'`-样本数，以产生合成数据集
5000(默认)|正整数标量值

为合成数据集生成的样本数，指定为逗号分隔对，由'NumSyntheticData'和一个正整数标量值。此参数仅在以下情况下有效'datalocality'是'当地的'．

例子:'NumSyntheticData'，2500

数据类型：单|双倍的

对于简单模型选项

全部展开

`'KernelWidth'`-粒宽
0.75(默认)|数字标量值

平方指数(或高斯)核函数的核宽度，指定为逗号分隔对组成'KernelWidth'和一个数值标量值。

这石灰函数计算查询点与合成预测数据集中样本之间的距离，然后使用平方指数核函数将距离转换为权值。如果你降低'KernelWidth'值，则石灰使用了更侧重于查询点附近的样本权重。有关详细信息，请参阅石灰．

例子:'KernelWidth'，0.5

数据类型：单|双倍的

`'simplemodeltype'`-简单的模型的类型
`“线性”`(默认)|`'树'`

简单模型的类型，指定为逗号分隔的对组成'simplemodeltype'和“线性”或'树'．

“线性”- 该软件通过使用适合的线性模型菲特利恩回归或者FitClinear.进行分类。
'树'-该软件采用决策树模型fitrtree回归或者fitctree进行分类。

例子:“SimpleModelType”、“树”

数据类型：字符|细绳

机器学习模型选项

全部展开

`'pationoricalpricictors'`-分类预测因子表
正整数向量|逻辑矢量|字符矩阵|字符串数组|字符向量的单元格阵列|`“全部”`

分类预测器列表，指定为逗号分隔对，由'pationoricalpricictors'和此表中的一个值。

价值	描述
正整数的向量	向量中的每个条目是与包含分类变量的预测数据列对应的索引值。
逻辑向量	一种`真正的`输入意味着预测数据的对应列是一个分类变量。
字符矩阵	矩阵的每一行是预测器变量的名称。名称必须匹配表格中的预测器数据的变量名称。使用额外的空白填充名称，因此字符矩阵的每行具有相同的长度。
字符串阵列或字符向量的单元数组	数组中的每个元素都是预测变量的名称。这些名称必须以表格的形式与预测数据的变量名称相匹配。
`“全部”`	所有的预测都是绝对的。

如果您指定黑盒子作为函数句柄石灰从预测数据中确定分类预测X或customSyntheticData．如果预测器数据在表中，石灰假定一个变量是分类，如果它是一个逻辑向量，无序的分类矢量，字符数组，字符串数组，或字符向量的单元阵列。如果预测数据是矩阵，石灰假设所有预测因子都是连续的。要将任何其他预测因子识别为分类预测器，请通过使用来指定它们'pationoricalpricictors'名称值对参数。
如果您指定黑盒子作为回归或分类模型对象石灰通过使用CategoricalPredictors属性。

石灰不支持有序分类预测金宝app。

例子:“CategoricalPredictors”、“所有”

数据类型：单|双倍的|逻辑|字符|细绳|细胞

`“类型”`-机器学习模型的类型
`'回归`|`'分类'`

键入机器学习模型的，指定为逗号分隔的一对组成的“类型”和'回归或'分类'．

当你指定你必须指定此参数黑盒子作为函数句柄。如果您指定黑盒子作为回归或分类模型对象石灰确定“类型”值取决于模型类型。

例子:“类型”，“分类”

数据类型：字符|细绳

用于计算距离的选项

全部展开

`“距离”`-距离度量
字符向量|字符串标量|功能手柄

距离度量，指定为逗号分隔对，由“距离”以及字符向量、字符串标量或函数句柄。

如果预测数据仅包括连续变量，则石灰金宝app支持这些距离度量。

价值	描述
`“欧几里得”`	欧氏距离。
`“seuclidean”`	标准化的欧几里德距离。观测值之间的每个坐标差是由标准偏差的对应元件除以缩放，`S = STD（PD， 'omitnan'）`，在哪里`PD.`是预测数据或合成预测数据。要指定不同的缩放，请使用`'规模'`名称值对参数。
`“马氏`	使用样本协方差的Mahalanobis距离`PD.`那`C = COV（PD， 'omitrows'）`．要更改协方差矩阵的值，请使用`“冠状病毒”`名称值对参数。
`'城市街区'`	城市街区的距离。
`“明可夫斯基”`	闵可夫斯基距离。默认指数是2。要指定不同的指数，请使用`“P”`名称值对参数。
`“切比切夫”`	Chebychev距离（最大坐标差异）。
`的余弦`	1减去点之间夹角的余弦值(作为向量)。
`“相关性”`	一减去点之间的样本相关性(作为值的序列处理)。
`“矛曼”`	1减去观察值之间的样本斯皮尔曼等级相关性(作为值的序列处理)。
`@distfun`	自定义距离函数句柄。距离函数的形式为功能D2 = distfun（ZI，ZJ）%距离计算...... 在哪里 `Zi.`是一个`1`——- - - - - -`T.`载体含有单个观察。 `ZJ.`是一个`S.`——- - - - - -`T.`包含多个观测值的矩阵。`distfun`必须接受矩阵`ZJ.`具有任意数量的观察。 `D2`是一个`S.`——- - - - - -`1`距离向量`D2（k）`是观测之间的距离`Zi.`和`ZJ (k,:)`．如果数据不是稀疏的，通常可以使用内置距离度量而不是函数句柄更快地计算距离。

如果预测数据包括连续变量和分类变量，然后石灰金宝app支持这些距离度量。

价值	描述
`“goodall3”`	改性古德尔距离
`海底钻井的`	发生频率距离

定义,请参阅距离度量．

默认值是“欧几里得”如果预测数据只包含连续变量，或“goodall3”如果预测数据包括连续变量和分类变量。

例子:“距离”、“海底钻井的

数据类型：字符|细绳|function_handle.

`“冠状病毒”`-为马氏距离度量的协方差矩阵
正定矩阵

协方差矩阵的马哈拉诺比斯距离度量，指定为逗号分隔的一对组成的“冠状病毒”A.K.——- - - - - -K.正定矩阵，其中K.是预测值的数量。

此参数仅当“距离”是“马氏．

默认值“冠状病毒”价值是COV（PD，'omitrows'），在哪里PD.是预测数据或合成预测数据。如果您没有指定“冠状病毒”值，然后该软件在计算预测器数据和合成预测器数据的距离时使用不同的协方差矩阵。

例子:“浸”,眼睛(3)

数据类型：单|双倍的

`“P”`-指数为闵可夫斯基距离度量
`2`(默认)|正标量

闵可夫斯基距离度量的指数，指定为逗号分隔对，由“P”和正标量。

此参数仅当“距离”是“明可夫斯基”．

例子:'P'，3

数据类型：单|双倍的

`'规模'`-尺度参数值的标准欧几里得距离度量
非负数值向量

对于标准化欧几里德距离度量，指定为逗号分隔的一对组成的比例参数值'规模'和一个长度的非负数字矢量K.，在哪里K.是预测值的数量。

此参数仅当“距离”是“seuclidean”．

默认值'规模'价值是STD（PD， 'omitnan'），在哪里PD.是预测数据或合成预测数据。如果您没有指定'规模'值，然后软件在计算预测器数据和合成预测器数据的距离时使用不同的比例参数。

例子:'Scale'，Smianile（x，0.75） - smartile（x，0.25）

数据类型：单|双倍的

属性

全部展开

指定的属性

在创建对象时，可以指定以下属性石灰对象。

`BlackboxModel`-需要解释的机器学习模型
回归模型对象|分类模型对象|功能手柄

此属性是只读的。

要解释的机器学习模型，指定为回归或分类模型对象或函数句柄。

这黑盒子参数设置此属性。

`CategoricalPredictors`-分类预测指标
正整数向量|`［］`

此属性是只读的。

分类预测指标，指定为一个正整数向量。CategoricalPredictors包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的，则此属性为空(［］）.

如果您指定黑盒子使用函数句柄，然后石灰从预测数据中确定分类预测X或customSyntheticData．如果您指定了'pationoricalpricictors'名称 - 值对参数，则参数设置该属性。
如果您指定黑盒子作为回归或分类模型对象石灰通过使用CategoricalPredictors属性。

石灰不支持有序分类预测金宝app。

如果'simplemodeltype'是“线性”(默认)石灰创建针对每个识别分类预测虚拟变量。石灰将指定查询点的类别视为引用组，并创建一个比类别数少的虚拟变量。有关详细信息，请参阅带参考组的虚拟变量．

数据类型：单|双倍的

`DataLocality`-用于数据生成的合成数据的局部性
`“全球”`|`'当地的'`

此属性是只读的。

数据生成的合成数据的局部性，指定为“全球”或'当地的'．

这'datalocality'名称-值对参数设置此属性。

`NumImportantPredictors`-简单模型中使用的重要预测值的数量
正整数标量值

此属性是只读的。

简单模型中使用的重要预测因子数量（SimpleModel)，指定为正整数标量值。

这numImportantPredictors的观点石灰或者是numImportantPredictors的观点适合设置此属性。

数据类型：单|双倍的

`numsyntheticdata.`-合成数据集中的样本数
正整数标量值

此属性是只读的。

合成数据集中的样本数，指定为正整数标量值。

如果您指定customSyntheticData，则自定义合成数据集中的样本数将设置此属性。
否则,'NumSyntheticData'的名称-值对参数石灰或者是'NumSyntheticData'的名称-值对参数适合设置此属性。

数据类型：单|双倍的

`QueryPoint`-查询点
数值的行向量|单列表

此属性是只读的。

查询点石灰解释使用简单模型的预测（SimpleModel)，指定为数值或单行表的行向量。

这查询点的观点石灰或者是查询点的观点适合设置此属性。

数据类型：单|双倍的|桌子

`类型`-机器学习模型的类型
`'回归`|`'分类'`

此属性是只读的。

机器学习模型的类型（BlackboxModel），指定为'回归或'分类'．

如果您指定黑盒子作为回归或分类模型对象石灰根据模型类型确定此属性。
如果您指定黑盒子使用函数句柄，然后“类型”名称-值对参数设置此属性。

`X`-预测数据
数字矩阵|桌子

此属性是只读的。

预测数据，指定为数字矩阵或表。

每一排X对应一个观察值，每一列对应一个变量。

如果您指定了X参数，则参数设置该属性。
如果您指定了customSyntheticData参数，则此属性为空。
如果您指定黑盒子作为完整机器学习模型对象，并未指定X或customSyntheticData，然后该属性值是用于训练的预测数据黑盒子．

数据类型：单|双倍的|桌子

计算属性

该软件计算下列属性。

`黑匣子`-预测查询点通过机器学习模型计算
标量

此属性是只读的。

预测查询点计算通过机器学习模型（BlackboxModel)，指定为标量。

数据类型：单|双倍的|绝对的|逻辑|字符|细绳|细胞

`合身`-预测用于通过机器学习模型计算的合成预测数据
向量

此属性是只读的。

由机器学习模型计算的合成预测数据的预测(BlackboxModel），指定为矢量。

数据类型：单|双倍的|绝对的|逻辑|字符|细绳|细胞

`ImportantPredictors`-重要的预测指标
正整数向量

此属性是只读的。

重要的预测指标，指定为正整数向量。ImportantPredictors包含对应于在简单的模型中使用的预测值的列中的指标值（SimpleModel）.

数据类型：单|双倍的

`SimpleModel`-简单的模型
`RegressionLinear`模型对象|`RegressionTree`模型对象|`ClassificationLinear`模型对象|`分类树`模型对象

此属性是只读的。

简单模型，指定为RegressionLinear那RegressionTree那ClassificationLinear,或分类树模型对象。石灰根据机器学习模型的类型确定简单模型对象的类型(类型)以及简单模型的类型('simplemodeltype'）.

`简单模型`-简单模型计算的查询点预测
标量

此属性是只读的。

简单模型计算的查询点的预测（SimpleModel)，指定为标量。

如果SimpleModel是ClassificationLinear，那么简单模型值为1或-1。

这简单模型如果简单模型的预测值与黑匣子(来自机器学习模型的预测)。
这简单模型如果简单模型的预测不同，则值为-1黑匣子．如果黑匣子价值是一种，那么情节功能显示简单模型值不是一个．

数据类型：单|双倍的|绝对的|逻辑|字符|细绳|细胞

`SyntheticData`-综合预测数据
数字矩阵|桌子

此属性是只读的。

合成预测器数据，指定为数字矩阵或表。

如果您指定了customSyntheticData输入参数，然后该参数设置此属性。
否则,石灰来自预测数据估计分布参数X并产生一个合成的预测数据集。

数据类型：单|双倍的|桌子

目标函数

`适合`	当地解释的模型无关的解释飞度简单模型（LIME）
`情节`	当地解释的模型无关的解释剧情结果（LIME）

例子

全部崩溃

用决策树简单模型解释预测

打开生活的脚本

培训分类模型并创建石灰使用决策树简单模型的对象。当你创造一个石灰对象，指定查询点和重要预测器的数量，以便软件生成合成数据集的样本，并为具有重要预测器的查询点拟合一个简单模型。然后利用目标函数在简单模型中显示估计的预测量的重要性情节．

加载CreditRating_Historical数据集。该数据集包含客户ID及其财务比率、行业标签和信用评级。

台= readtable ('信用_historical.dat'）;

显示表的前三行。

头(资源描述,3)

ans =.3×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级  _____ _____ _____ _______ ________ _____ ________ ______ 62394 0.013 0.104 0.036 0.447 0.142 3{“BB”}48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

通过删除客户id和评级列来创建一个预测器变量表tbl．

tblx = removevars（tbl，[“ID”那“评级”]）;

通过使用培训Blackbox模型的信用评级模型fitcecoc.函数。

黑箱= fitcecoc (tblX,资源描述。评级,'pationoricalpricictors'那“行业”）;

创建一个石灰对象，该对象使用决策树简单模型解释最后一次观察的预测。具体说明“NumImportantPredictors”至于最多6个重要预测因子。如果您指定了'QueryPoint'和“NumImportantPredictors”当您创建石灰对象，然后软件生成一个合成数据集的样本，并将一个简单的可解释模型适合于该合成数据集。你的结果可能与由于随机性所示的变化石灰．您可以设置一个随机种子使用RNG.用于再现性。

queryPoint=tblX（结束：）

查询点=1×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业  _____ _____ _______ ________ ____ ________ 0.239 0.463 0.065 2.924 0.34 - 2

结果=石灰（黑盒，'QueryPoint'queryPoint,“NumImportantPredictors”6......'pationoricalpricictors'那“行业”那'simplemodeltype'那'树'）

结果=石灰与属性：BlackboxModel：[1×1 ClassificationECOC] DataLocality： '全局' CategoricalPredictors：6类型： '分类' X：[3932×6表] QueryPoint：[1×6表] NumImportantPredictors：6个NumSyntheticData：5000 SyntheticData：[5000×6表]合身：{5000×1细胞} SimpleModel：[1×1 ClassificationTree] ImportantPredictors：[2 4] BlackboxFitted：{ 'AA'} SimpleModelFitted：{ 'AA'}

绘制石灰目的结果通过使用目标函数情节．要显示任何预测名称的现有下划线，改变ticklabelinterpreter.轴到的值'没有任何'．

f =情节(结果);f.CurrentAxes.TickLabelInterpreter ='没有任何'；

绘图显示查询点的两个预测，它们对应于黑匣子财产和简单模型性质结果．

水平条形图显示排序的预测值重要性值。石灰查找财务比率变量息税前利润和WC_TA作为查询点的重要预测器。

您可以通过使用数据提示或栏属性. 例如，您可以找到酒吧通过使用对象findobj函数，并在栏的末端添加标签文本函数。

B = findobj（F，“类型”那'酒吧'）;文本（b.YEndPoints + 0.001，b.XEndPoints，串（b.YData））

或者，您可以使用预测器变量名在表中显示系数值。

小鬼= b.YData;flipud (array2table(小鬼”,......“RowNames”f.CurrentAxes.YTickLabel,'VariableNames', {“预测的重要性”}）））

ans =.2×1表预测的重要性  ____________________ MVE_BVTD 0.088695 RE_TA 0.0018228

解释预测与线性简单模型

打开生活的脚本

训练回归模型并创建石灰对象，该对象使用线性简单模型。当你创造一个石灰对象，如果不指定查询点和重要的预测数，则该软件生成的合成数据集的样本，但是不符合一个简单的模型。使用对象功能适合以适应查询点的简单模型。然后用目标函数显示拟合的线性简单模型的系数情节．

加载carbig数据集，其中包含在上世纪70年代和80年代初制造的汽车的测量..

负载carbig

创建一个包含预测变量的表加速那气瓶，等等，以及响应变量MPG.．

TBL =表（加速度，缸，排气量，马力，Model_Year，体重，MPG）;

在训练组中删除丢失的值可以帮助减少内存消耗和加快培训菲特克内尔函数。删除tbl．

台= rmmissing(台);

通过删除响应变量来创建预测变量表tbl．

tblX = removevars(资源描述,'mpg'）;

列车的黑匣子模型MPG.通过使用菲特克内尔功能，并创建一个石灰对象。指定一个预测器数据集，因为mdl不包含预测数据。你的结果可能与由于随机性所示的变化菲特克内尔和石灰．您可以设置一个随机种子使用RNG.用于再现性。

mdl = fitrkernel (tblX,资源描述。英里/加仑,'pationoricalpricictors'[2 - 5]);结果=石灰(mdl tblX,'pationoricalpricictors'，[2 5]）

结果=石灰与属性:BlackboxModel:[1×1 RegressionKernel] DataLocality:“全球”CategoricalPredictors:[2 5]类型:“回归”X:[392×6表]QueryPoint: [] NumImportantPredictors: [] NumSyntheticData: 5000 SyntheticData:[5000×6表]安装:[5000×1双]SimpleModel: [] ImportantPredictors: [] BlackboxFitted:[] SimpleModelFitted: []

结果包含生成的合成数据集。这SimpleModel属性为空(［］）.

为第一次观测拟合线性简单模型tblx.．指定要查找的重要预测器的数量为3。

queryPoint = tblX（1，:)

查询点=1×6表加速度油缸位移马力Model_Year重量____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504

结果=拟合（结果，queryPoint，3）;

绘制石灰目的结果通过使用目标函数情节．要显示任何预测名称的现有下划线，改变ticklabelinterpreter.轴到的值'没有任何'．

f =情节(结果);f.CurrentAxes.TickLabelInterpreter ='没有任何'；

绘图显示查询点的两个预测，它们对应于黑匣子财产和简单模型性质结果．

水平条形图显示简单模型的系数值，按其绝对值排序。石灰发现马力那Model_Year,气瓶作为查询点的重要预测器。

对于多查询点飞度简单模型

打开生活的脚本

培训分类模型并创建石灰使用决策树简单模型的对象。适合多个查询点的多种型号。

加载CreditRating_Historical数据集。该数据集包含客户ID及其财务比率、行业标签和信用评级。

台= readtable ('信用_historical.dat'）;

通过删除客户id和评级列来创建一个预测器变量表tbl．

tblx = removevars（tbl，[“ID”那“评级”]）;

通过使用培训Blackbox模型的信用评级模型fitcecoc.函数。

黑箱= fitcecoc (tblX,资源描述。评级,'pationoricalpricictors'那“行业”）

blackbox = ClassificationECOC PredictorNames: {'WC_TA' 'RE_TA' 'EBIT_TA' 'MVE_BVTD' 'S_TA' 'Industry'} ResponseName: 'Y' CategoricalPredictors: 6 ClassNames: {'A' ' 'AA' ' 'AAA' ' 'B' ' 'BB' 'BBB' ' 'CCC'} ScoreTransform: 'none' BinaryLearners: {21×1 cell} CodingName: 'onevsone'属性，方法

创建一个石灰对象的黑盒子模型由于数据的随机性，您的结果可能与显示的结果不同石灰．您可以设置一个随机种子使用RNG.用于再现性。

结果=石灰（黑盒，'pationoricalpricictors'那“行业”）;

发现两个查询点，其真实的评价值AAA和B.，分别。

queryPoint（1，:) = tblX（FIND（STRCMP（tbl.Rating，“AAA”), 1):);queryPoint (2) = tblX(找到(strcmp(资源描述。评级,'B'), 1),:)

查询点=2×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业_____ _____ _______ ________ _____ ________ 0.121 0.413 0.057 3.647 0.466 0.019 12 0.009 0.042 0.257 0.119 1

适合第一个查询点的线性简单模型。将重要预测因子的数量设置为4。

newresults1 =适合(结果,queryPoint (1:), 4);

绘制LIME结果图新结果1第一个查询点。要显示任何预测名称的现有下划线，改变ticklabelinterpreter.轴到的值'没有任何'．

f1 =情节(newresults1);f1.CurrentAxes。TickLabelInterpreter ='没有任何'；

适用于第一个查询点的线性决策树模型。

newresults2 =适合(结果,queryPoint(1:), 6日'simplemodeltype'那'树'）;f2 =情节(newresults2);f2.CurrentAxes。TickLabelInterpreter ='没有任何'；

简单的模型新结果1和新结果2既找到MVE_BVTD和RE_TA作为重要的预测因子。

适用于第二个查询点的线性简单模型，并对第二个查询点绘制石灰结果。

newresults3=拟合（结果，查询点（2，：），4）；f3=绘图（新结果3）；f3.CurrentAxes.TickLabelInterpreter='没有任何'；

来自黑盒子模型是B.，但简单模型的预测则不然B.．当两个预测是不一样的，你可以指定一个较小的'KernelWidth'价值。该软件使用更重要的权重拟合在查询点附近的样本上的权重。如果查询点是异常值或位于决策边界附近，那么即使指定小型，两个预测值也可以不同'KernelWidth'价值。在这种情况下，您可以更改其他名称 - 值对的参数。例如，您可以生成本地合成数据集（指定'datalocality'的石灰作为'当地的'）对于查询点并增加样本的数量（'NumSyntheticData'的石灰或适合）在合成数据集中。您还可以使用不同的距离度量（“距离”的石灰或适合）.

适合线性简单模型，小'KernelWidth'价值。

newresults4 =适合(结果,queryPoint (2:), 4,'KernelWidth', 0.01);f4 =情节(newresults4);f4.CurrentAxes。TickLabelInterpreter ='没有任何'；

第一个和第二个查询点的信用评级是AAA和B.，分别。简单的模型新结果1和新结果4既找到MVE_BVTD那RE_TA,WC_TA作为重要的预测因子。但是，它们的系数值是不同的。图表显示，这些预测者的行为因信用评级的不同而不同。

算法

全部展开

石灰

使用LIME解释机器学习模型的预测［1］，该软件生成一个合成数据集，并通过使用该合成数据集拟合一个简单的可解释模型石灰和适合，在步骤1-5所描述的。

如果您指定了查询点和numImportantPredictors价值观石灰，那么石灰函数执行所有步骤。
如果您未指定查询点和numImportantPredictors并指定'datalocality'作为“全球”（默认），则石灰函数生成一个合成数据集（步骤1-2），并且适合功能适合一个简单的模型(步骤3-5)。
如果您未指定查询点和numImportantPredictors并指定'datalocality'作为'当地的'，那么适合函数执行所有步骤。

这石灰和适合功能执行以下步骤：

生成合成预测数据集X_S.对连续变量使用多元正态分布，对每个分类变量使用多项式分布。可以使用指定要生成的样本数'NumSyntheticData'名称值对参数。
- 如果'datalocality'是“全球”(默认)，然后软件从整个预测器数据集(X或预测数据黑盒子）.
- 如果'datalocality'是'当地的'，那么软件估计使用分布参数K.查询点的最邻居，在哪里K.是“NumNeighbors”价值。您可以指定距离度量标准，以通过使用距离指标来查找最近的邻居“距离”名称值对参数。
当估计分布参数时，该软件忽略预测器数据集中的缺失值。
或者，您可以通过使用customSyntheticData输入参数的石灰．
计算预测y_S.对于合成数据集X_S.. 这个预测ions are predicted responses for regression or classified labels for classification. The software uses the预测的函数黑盒子模型来计算预测。如果您指定黑盒子作为函数句柄，然后软件使用函数句柄计算预测。
计算距离D.查询点和由规定的使用距离度量在合成预测数据集的样本之间“距离”．
计算权重值W._问：关于查询点的合成预测数据集中的样本数问：采用平方指数（或高斯）内核函数

${W.}_{问：} （ X_{S.} ） = exp. （ - \frac{1}{2} {（ \frac{D. （ X_{S.} 那问：）}{\sqrt{P.} σ} ）}^{2} ）．$
- X_S.是否在合成预测数据集中有一个样本X_S.．
- D.（X_S.那问：）样品之间的距离是多少X_S.和查询点问：．
- P.是预测的在数X_S.．
- σ是内核宽度，您可以通过使用指定'KernelWidth'名称值对参数。默认值'KernelWidth'该值为0.75。
查询点的权值为1，然后随着距离值的增加，权值收敛为0。这'KernelWidth'值控制权重值收敛到零的速度。越低'KernelWidth'值越大，权值收敛到零的速度越快。因此，该算法赋予了查询点附近的样本更大的权重。由于该算法使用了这样的权重值，所选择的重要预测因子和拟合的简单模型有效地解释了查询点附近的局部合成数据的预测。
适合一个简单的模型。
- 如果'simplemodeltype'是“线性”（默认），然后软件选择重要预测值并拟合所选重要预测值的线性模型。
  - 选择N重要的预测因子( ${\overset{〜}{X}}_{S.}$ ）通过使用该组正交匹配追踪（OMP）算法［2］[３]，在哪里N是numImportantPredictors价值。该算法利用合成预测数据集（X_S.），预测（y_S.)和权重值(W._问：）.
  - 拟合所选重要预测值的线性模型( ${\overset{〜}{X}}_{S.}$ )与预测相符(y_S.)，使用权重值(W._问：）.软件使用菲特利恩回归或者FitClinear.进行分类。对于多种多组模型，该软件使用一个与所有方案来构造二进制分类问题。正类是从中查询点的预测类黑盒子模型，负类指的是其他类。
- 如果'simplemodeltype'是'树'然后，软件使用fitrtree回归或者fitctree用于分类。软件将决策拆分（或分支节点）的最大数量指定为重要预测器的数量，以便拟合的决策树最多使用指定数量的预测器。

工具书类

[1] Ribeiro，Marco Tulio，S. Singh和C.宾馆。“”我为什么要相信你？'：解释任何分类器的预测。“第22届ACM SIGKDD国际知识发现与数据挖掘会议论文集1135-44。旧金山加利福尼亚州美国：ACM，2016。

[2]świrszcz，grzegorz，naoki abe和auréliec. lozano。“分组正交匹配追求变量选择和预测。”神经信息处理系统研究进展（2009年）：1150年至1158年。

[3] Lozano Aurélie C.， Grzegorz Świrszcz，和Naoki Abe。逻辑回归的组正交匹配追踪。第十四届国际会议人工智能和统计程序（2011）：452-60。

也可以看看

绘图竞争依赖性

在R2020b中引入

石灰

描述

创建

语法

描述

输入参数

黑盒子-需要解释的机器学习模型回归模型对象|分类模型对象|功能手柄

X-预测数据数字矩阵|桌子

customSyntheticData-预先生成的，定制合成的预测数据集［］(默认)|数字矩阵|桌子

查询点-查询点数值的行向量|单列表

numImportantPredictors-简单模型中使用的重要预测值的数量正整数标量值

'datalocality'-用于数据生成的合成数据的局部性“全球”(默认)|'当地的'

“NumNeighbors”-查询点的邻居数1500(默认)|正整数标量值

'NumSyntheticData'-样本数，以产生合成数据集5000(默认)|正整数标量值

'KernelWidth'-粒宽0.75(默认)|数字标量值

'simplemodeltype'-简单的模型的类型“线性”(默认)|'树'

'pationoricalpricictors'-分类预测因子表正整数向量|逻辑矢量|字符矩阵|字符串数组|字符向量的单元格阵列|“全部”

“类型”-机器学习模型的类型'回归|'分类'

“距离”-距离度量字符向量|字符串标量|功能手柄

“冠状病毒”-为马氏距离度量的协方差矩阵正定矩阵

“P”-指数为闵可夫斯基距离度量2(默认)|正标量

'规模'-尺度参数值的标准欧几里得距离度量非负数值向量

属性

指定的属性

BlackboxModel-需要解释的机器学习模型回归模型对象|分类模型对象|功能手柄

CategoricalPredictors-分类预测指标正整数向量|［］

DataLocality-用于数据生成的合成数据的局部性“全球”|'当地的'

NumImportantPredictors-简单模型中使用的重要预测值的数量正整数标量值

numsyntheticdata.-合成数据集中的样本数正整数标量值

QueryPoint-查询点数值的行向量|单列表

类型-机器学习模型的类型'回归|'分类'

X-预测数据数字矩阵|桌子

计算属性

黑匣子-预测查询点通过机器学习模型计算标量

合身-预测用于通过机器学习模型计算的合成预测数据向量

ImportantPredictors-重要的预测指标正整数向量

SimpleModel-简单的模型RegressionLinear模型对象|RegressionTree模型对象|ClassificationLinear模型对象|分类树模型对象

简单模型-简单模型计算的查询点预测标量

SyntheticData-综合预测数据数字矩阵|桌子

目标函数

例子

用决策树简单模型解释预测

解释预测与线性简单模型

对于多查询点飞度简单模型

更多关于

距离度量

算法

石灰

工具书类

也可以看看

统计和机器学习工具箱文档

金宝app

掌握机器学习：用MATLAB逐步指导

`黑盒子`-需要解释的机器学习模型
回归模型对象|分类模型对象|功能手柄

`X`-预测数据
数字矩阵|桌子

`customSyntheticData`-预先生成的，定制合成的预测数据集
`［］`(默认)|数字矩阵|桌子

`查询点`-查询点
数值的行向量|单列表

`numImportantPredictors`-简单模型中使用的重要预测值的数量
正整数标量值

`'datalocality'`-用于数据生成的合成数据的局部性
`“全球”`(默认)|`'当地的'`

`“NumNeighbors”`-查询点的邻居数
1500(默认)|正整数标量值

`'NumSyntheticData'`-样本数，以产生合成数据集
5000(默认)|正整数标量值

`'KernelWidth'`-粒宽
0.75(默认)|数字标量值

`'simplemodeltype'`-简单的模型的类型
`“线性”`(默认)|`'树'`

`'pationoricalpricictors'`-分类预测因子表
正整数向量|逻辑矢量|字符矩阵|字符串数组|字符向量的单元格阵列|`“全部”`

`“类型”`-机器学习模型的类型
`'回归`|`'分类'`

`“距离”`-距离度量
字符向量|字符串标量|功能手柄

`“冠状病毒”`-为马氏距离度量的协方差矩阵
正定矩阵

`“P”`-指数为闵可夫斯基距离度量
`2`(默认)|正标量

`'规模'`-尺度参数值的标准欧几里得距离度量
非负数值向量

`BlackboxModel`-需要解释的机器学习模型
回归模型对象|分类模型对象|功能手柄

`CategoricalPredictors`-分类预测指标
正整数向量|`［］`

`DataLocality`-用于数据生成的合成数据的局部性
`“全球”`|`'当地的'`

`NumImportantPredictors`-简单模型中使用的重要预测值的数量
正整数标量值

`numsyntheticdata.`-合成数据集中的样本数
正整数标量值

`QueryPoint`-查询点
数值的行向量|单列表

`类型`-机器学习模型的类型
`'回归`|`'分类'`

`X`-预测数据
数字矩阵|桌子

`黑匣子`-预测查询点通过机器学习模型计算
标量

`合身`-预测用于通过机器学习模型计算的合成预测数据
向量

`ImportantPredictors`-重要的预测指标
正整数向量

`SimpleModel`-简单的模型
`RegressionLinear`模型对象|`RegressionTree`模型对象|`ClassificationLinear`模型对象|`分类树`模型对象

`简单模型`-简单模型计算的查询点预测
标量

`SyntheticData`-综合预测数据
数字矩阵|桌子