MATLAB中的模型解释性

爱马仕孙,MathWorks

可解释机器学习(或在深度学习中称为“可解释的人工智能”)提供了克服人工智能模型黑箱特性的技术和算法。通过揭示各种特征如何有助于(或不有助于)预测，您可以验证模型使用了正确的证据进行预测，并揭示在训练期间不明显的模型偏差。

概述模型解释性和IT地址的用例。对于有兴趣采用机器学习但疲惫不堪的黑匣子型号的工程师和科学家，我们解释了可解释性如何满足法规，在机器学习中建立信任，并验证该模型正在运行。这在融资和医疗设备等行业中尤为重要，规定设定严格的指导。我们概述了机器学习的可解释方法以及如何在Matlab®中应用它们。我们证明了在医学应用的背景下的可解释性，基于ECG信号进行分类心脏心律失常。

近年来，我们看到人工智能和机器学习算法在许多智能任务上超过或超过了人类的表现，比如医学成像诊断和驾驶汽车。然而，这些成就的核心缺失的是对这些算法如何工作的直观理解。

这段视频解释了为什么解释性很重要，解释性的方法有哪些，并演示了如何在Matlab中使用这些技术。具体来说，我们将研究LIME、部分依赖图和置换预测器重要性算法。我们将在心电图分类的背景下检查解释性。所描述的技术可应用于任何模型。在这段视频之后，不需要有医学背景。

为什么我们需要解释性？要开始，机器学习模型并不直接了解，并且更准确的模型通常不太可解释。此外，需要可解释性方法来帮助在医疗，金融和安全行业中导航监管障碍。

还需要可解释的模型来确保他们使用正确的证据并揭示培训数据中的偏见。最近对AI的灾难性使用是信用卡评分，其中据报道，算法对女性的男性提供了更高的信用限制。这可能是由于训练数据中的偏差，实时数据中的偏见，或其他东西。解释模型有助于我们防止这些问题。

对于我们的示例，您将对培训的机器学习模型应用可解释性，以将心跳分类为基于来自两个公开可用数据库的ECG数据的异常或正常。ECG代表了心脏对窦票据的电刺激的反应，并且通常分解成QRS方式。我们将使用Matlab的小波工具箱从原始信号数据自动提取QR波的位置。从那里，我们从R-Peaks中提取了八个功能以用于培训。

一旦我们有了这些特征，我们就可以使用分类学习器快速训练模型。在这里，我们训练了一个决策树作为一个固有的可解释模型的例子，以及两个复杂的模型。如果准确性是所有的问题，它只会选择性能最高的模型。然而，在诸如预测临终关怀等情况下，可解释性非常重要。我们将希望确保模型使用正确的证据进行预测，并了解模型可能出错的情况。

使用MATLAB置换的预测函数，我们看到，对于我们最好的执行模型，随机森林，R波的幅度被包括为重要的预测因子。然后，我们可以使用Matlab的部分家属图来量化R幅度对模型输出的影响。我们看到，随着振幅接近0，这有助于输出异常心跳分类的可能性5％的变化。

然而，这与我们的领域知识相矛盾。专家说，r振幅水平对心跳的分类应该没有什么影响。我们希望确保数据中的这些偏差不包括在我们的模型中。接下来，我们重新训练我们的模型，不把振幅作为预测因素。一旦我们消除了偏差，我们就可以看到我们的新决策树在全球层面上是如何工作的。树并不关注r振幅，而是认为RR0和RR2区间是最重要的预测因子。

对于更复杂的模型，比如随机森林，我们再次利用部分依赖图来看看最重要的预测因子是如何影响模型的。我们发现极短的RR1间隔通常导致异常心跳分类的概率较高。直觉上，这是有道理的。

我们还可以使用部分依赖性图来比较不同的模型。查看SVM的相同功能表明它具有与我们随机林有类似的趋势。然而，绘图要更光滑，表明SVM对方差和输入数据的敏感性不太敏感，使其成为一种更可解释的模型。

除了了解这些模型如何在全球范围内工作之外，其他情况可能还需要我们了解它们如何在单个预测中工作。LIME是一种围绕感兴趣的点观察数据点和模型预测的技术。从那里，它建立了一个简单的线性模型，作为我们的复杂模型的一个近似。近似线性模型的系数被用作代理，以确定每个特征对我们感兴趣点周围的预测有多大的贡献。

让我们看看一个被SVM误分类为正常的观察结果。我们可以看到，在这个观察中RR0的值是0.0528。从我们之前的部分依赖图中，我们注意到在0.05左右的值，预测异常心跳的概率会下降。我们还可以看到LIME对RR0施加了很高的负权重。RR0的高值和负加权降低了预测异常心跳的概率，解释了我们的错误分类。

然而，也有一些限制。LIME作为我们模型的一个近似，并不是我们模型如何工作的一个精确表示。为了说明这一点，我们可以看到，在一些情况下，我们的复杂模型的预测与近似不匹配。为了避免这种情况，尝试使用不同的参数再次运行LIME算法，直到预测一致，例如增加要绘制的重要预测器的数量。

我们已经证明了我们如何在MATLAB中使用可口译性技术，现在可以使用可解释性来比较不同的模型，揭示数据偏见，并理解为什么预测出错。即使没有数据科学背景，我们也可以成为使机器学习解释的运动的一部分。有关在视频中引入的任何技术的详细信息，请参阅下面的链接。神经网络也存在类似的可解释性技术，因此请务必查看这些资源。