在MATLAB模型解释能力
从系列:机器学习金融
可翻译的机器学习(或在深度学习,“可辩解的人工智能”)提供了技术和算法,克服人工智能的黑箱特性模型。通过揭示各种特性如何贡献(或不贡献)预测,你可以验证模型是否使用正确的预测和证据揭示模型偏差,没有明显的在训练。
得到模型的可解释性和用例概述地址。对于那些感兴趣的工程师和科学家采用机器学习但疲惫的黑箱模型,我们解释可解释性如何满足法规、机器学习中建立信任,并验证模型工作。这是特别重要的在金融和医疗设备等行业法规设立了严格的指导方针。我们提供的可解释性方法概述机器学习和如何应用MATLAB®。我们证明医疗应用程序的上下文中可解释性,心律失常分类基于心电信号。
近年来,我们看到了人工智能和机器学习算法超越或匹配人类性能在许多情报任务,如医学影像诊断和操作机动车辆。然而,什么是失踪的这些成就的核心是一个直观的理解这些算法是如何工作的。
这段视频解释了为什么解释能力是很重要的,有什么方法可解释性,演示了如何在MATLAB中使用这些技术。具体来说,我们将看看石灰,部分依赖情节和交换预测算法的重要性。我们将检查心电图分类的上下文中可解释性。描述的技术可以应用于任何模型。和医学背景不需要这个视频。
为什么我们需要解释能力吗?首先,机器学习模型不是简单的理解和更准确的模型通常是不解释。进一步,可解释性方法需要帮助导航在医疗监管障碍,金融和产业安全。
可说明的模型还需要确保他们使用正确的证据,揭示训练数据的偏差。最近的一次灾难性的使用人工智能算法在信用卡评分,据说是给男性/女性更高的信用额度。这可能是由于训练数据中的偏见,偏见在实时数据,或者其他东西。解释模型帮助我们避免这些问题。
对于我们的示例,您将可解释性适用于机器学习模型训练分类心跳异常或正常基于心电图数据从两个公开可用的数据库。心电图代表心脏窦注意对电刺激的反应,通常是分解成QRS方式。我们将使用Matlab的小波工具箱来自动提取原始信号的QRS波的位置数据。从那里,我们提取的八个特征从R-peaks用于培训。
一旦我们的特性,我们可以使用分类训练模型快速学习者。这里,我们训练有素的固有的决策树作为一个例子可说明的模型,与两个复杂的。如果精度都是那件事,它只会选择最高的执行模型。然而,在预测等情况下结束生命的护理,可解释性的重要性。我们需要确保模型是预测使用正确的证据,也了解情况模型可能的错误。
使用Matlab的排列预测函数,我们看到我们最好的执行模型,随机森林的振幅R-waves包括预测一样重要。我们可以使用Matlab的部分家属情节量化R-amplitude对模型输出的影响。振幅趋于0时,我们看到,这有助于改变5%的概率输出异常心跳分类。
然而,这与我们的领域知识。专家说,R-amplitude水平上并不会有什么影响分类的心跳。我们要确保这些偏见的数据不包含在我们的模型中。所以接下来,我们重新培训模型没有预测的振幅。一旦我们已经删除了偏见,我们可以看到我们的新决策树在全球范围内工作。而不是关注R-amplitudes,树认为RR0和RR2的间隔是最重要的预测因子。
随机森林等更复杂的模型,我们利用部分依赖情节看到我们最重要的预测因子如何影响模型。我们看到,极短RR1间隔通常导致心跳异常分类的概率更高。直观地说,这是有道理的。
我们还可以使用部分依赖情节比较不同模型。看着同样的支持向量机的特征表明,它有一个类似的趋势我们随机森林。然而,情节流畅,这表明支持向量机不太敏感的方差和输入数据,使它更可说明的模型。
除了理解这些模型如何工作在全球范围内,其他情况下可能呼吁为个体预测我们理解它们是如何工作的。石灰是一种技术,看着周围的数据点和模型预测的兴趣。从那里,它构建一个简单的线性模型,作为一个近似为我们复杂的一个。近似线性模型的系数被用作代理确定多少每个特性有助于预测在我们感兴趣的点。
让我们来看一个观察,我们的支持向量机分类为正常。我们看到,RR0在这个观测值是0.0528。从我们部分依赖情节之前,我们注意到在值约为0.05,预测异常心跳下降的概率。我们还可以看到,石灰RR0高度负重量。RR0的高价值和负权重降低的概率预测异常心跳,解释我们的误分类。
然而,也有一些局限性。石灰作为对我们的模型和近似的决不是一个精确的表示我们的模型是如何工作的。为了说明这一点,我们可以看到,在有些情况下,复杂的预测模型不匹配的近似。为了避免这种情况,试着再次运行石灰算法不同参数,直到预测同意,例如增加数量的情节的重要预测因子。
我们已经演示了如何使用MATLAB和可解释性技术现在可以使用可解释性比较不同模型,揭示数据偏差和理解为什么预言出错。即使没有数据科学背景,我们都能成为运动的机器学习可辩解的。有关更多信息,请参见下面的链接的任何技术介绍了视频。为神经网络类似的可解释性技术还存在,所以请一定要检查这些资源。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。