电子书

第1章:为什么要使用深度学习?

第1章

为什么要使用深度学习进行模式识别?


深度学习用于开发可以在数据中找到模式的模型;但是,这不是唯一能够这样做的方法。本章探讨了您可以选择深入了解另一种方法的原因。

一旦训练了一个模型,就可以输入未标记的数据,模型将根据它在训练时学到的信息应用最有可能的标签。

模式识别

以下是模式识别的两个简单示例:一个使用线性回归确定传感器数据随时间的变化趋势,另一个使用k-means算法将数据聚类到类似的组中。

许多这些非深度学习方法的好处是逻辑往往更加理解,并且它们使用较小量的相对更简单的数据。当您培训深度神经网络时,解释为什么它的工作可能很困难,并且网络需要更多的质量标记为培训。考虑到这一点,为什么有人会通过不同的方法选择深入学习?一个原因是深入学习非常适合在大型解决方案空间上找到真正复杂的模式。

例如,您可能希望在图像中查找和标记特定对象以进行对象跟踪和本地化,或者您可能希望在视觉上检查硬件以进行缺陷和物质损坏

在这些示例中,模式是代表行人或芯片混凝土等东西的像素的特定组合。这些是复杂的模式,可以与实例不同地不同,或者它们可能以微妙的方式变化,这些方式几乎无法与其他模式无法区分。因此,您不仅选择了对这些复杂模式进行分类的算法,但它必须在一个非常大的解决方案空间中执行此操作。

复杂模式也存在于非图像数据中。在音频信号中,您可能需要识别口语单词或从几个片段中识别歌曲。

在预测性维护应用和生物医学行业中的时间序列信号中也存在复杂的模式。

面板导航

使用深度学习的时间序列预测

使用长短期记忆(LSTM)网络预测时间序列数据。

面板导航

利用长、短期记忆网络对心电信号进行分类

使用深度学习和信号处理对来自PhysioNet 2017挑战赛的心跳心电图数据进行分类。

面板导航

利用小波分析和深度学习对时间序列进行分类

使用连续小波变换(CWT)和深卷积神经网络来分类人心电图(ECG)信号。

在所有这些情况下,解决方案存在的复杂性和范围可能使人难以提出基于规则的方法,在这种方法中,人类必须自己精心设计和管理逻辑。这就是深度学习可以成为一种更好的方法的地方。

注意:电子书中的示例专注于分类,将离散标签应用于数据。然而,回归,其中模型的输出是连续值而不是离散标签,也可以深入学习。了解如何培训卷积神经网络(CNN)以进行回归。

深度学习使用深度神经网络来建模输入数据和输出分类之间的关系。神经网络的细节超出了本章的范围;但是,简单地说,您可以将网络看作是一系列的层,每个层都对数据执行特定的操作。早期的层倾向于寻找存在于较大模式中的较小特征,然后稍后的层查看这些特征的组合,以确定数据最可能的标签。

特性如何帮助定义模式?

要了解深度学习的好处以及特征识别如何有助于更大的模式识别,想象一下,您需要开发一种可以从加速度数据识别高vifs的算法。

下图中的图形显示了三种不同手臂运动的加速度模式。中间的图表示击掌。你将如何开发一种算法来区分击掌动作和其他可能的手臂动作?

如果你知道所有的定义特征

您可能首先寻找一个简单的基于规则的方法来解决这个问题。一个解决方案可以是使用已知的高五种配置文件,即您可以针对来自传感器的传入的连续加速度测量流模式匹配。例如,函数可以看一下两个信号之间的标准偏差,并且当偏差降低到一些阈值时,可以提出一个高五。

然而,这种方法的困难在于,每一次击掌都是不一样的。有些人可能会更快或更慢地移动他们的手,在重重地一巴掌之前停下来,或者只是以一种奇怪的方式击掌。即使你能想出一个有代表性的人物形象,或者一组人物形象,像这样的方法可能并不适合它以前从未见过的击掌动作。另外,如果您添加了太多的配置文件或提高了标准偏差阈值,以确保您捕捉到每一个击掌动作,那么您就有将动作误标记为击掌的风险。

更聪明的方法可能是意识到,而不是整体看模式,这可以具有狂野的变化,您可以找到一组较小的功能,每个高五个都有共同点。

你可能会说a的任意组合慢 - 慢 - 快加速是一个高五个,即使您观察到新的高五,您没有明确收集数据。例如,这些高的Fives看起来不同,但它们表现出相同的慢速缓慢 - 快速加速度。

通过查找较小的功能并查看它们何时显示,您可以设计比简单的全模式匹配算法更好的基于规则的分类器。

使用这种基于规则的分类器的困难在于,您需要非常熟悉您正在寻找的模式,以确保您定义了正确分类所需的最佳特性。您还需要确信您已经处理了所有的变化,这样您就不会无意中使您的算法对矮个子、害羞的人、其他文化等产生偏见。对于非常复杂的模式,这可能非常耗时,甚至可能不可能手工完成。

如果您不知道所有定义功能

深度学习可以帮助解决这个问题。模式的特征,甚至是不完整的功能,在没有设计师明确定义它们的情况下自动学习。因此,如果您正在尝试对数据中的复杂模式进行分类,并且您无法定义与其他模式区分开该模式的所有规则,深度学习可能是探索的好选择。

请记住,深入学习有自己的一系列要求。您需要大量标记数据,您需要正确的网络架构,并且您需要确保网络可以部署到目标处理器并在分配的时间执行。此电子书的以下章节应解决这些要求。