电子书

第三章

数据预处理


精心准备深神经网络数据可以做出重大改变你的模型的准确性。本章考察为什么很重要特别是深度学习,和不同的网络和数据类型方面的考虑。

为什么预处理是必要的

数据预处理是一个非常广泛的术语。它基本上是你做的任何事都之前的原始数据输入到您的特定机器学习业务,重要的是至少有两个原因:

  • 它可以帮助降低数据的维数,使图案更加明显。
  • 它可以将数据转换成一种适用于网络架构。

降低数据的维数

深度学习列车网络识别数据中的模式。因此,任何信息,不需要认识到你正在寻找的模式可以删除而不影响整体的分类。

不仅是无关的数据不需要,删除它有助于使其余模式更加明显。一般来说,如果模式更明显的人类,他们会更明显深学习算法,它将帮助训练过程。

另一个原因来降低数据的维数是所谓的“维数的诅咒。“数据高维度有更多的功能和每个特性的变化,因此,需要更多的训练数据来覆盖解空间中所有可能的组合。不仅是数据本身更大更高的维度,但你需要更多的训练网络和整体需要更多网络复杂性,更多的数据存储和更多的时间来训练。

一种降维的缺点是成功,你必须了解你的数据。你需要知道你可以有效降低维度,但不是不小心把重要的信息从你的数据集。这是特定领域知识的部分原因为深度学习应用程序仍然是极其重要的。

举个例子,如果你正在训练一个网络,可以直观地识别制造缺陷在六角螺帽,你需要了解缺陷寻找和他们如何表现数据。在数据图片,它不会是一个好主意来减少这些图像的大小的范围缩小。缺陷或你正在寻找的模式非常小,你将失去细节,区分它们。在这种情况下,一个更好的降维方法可能是作物图像。

准备的数据网络架构

原始数据通常需要修改,以便适用于网络架构。这意味着确保数据是网络预计的规模,单位,和类型的信号。以下几个例子是为了给你一个不同的网络和数据类型和突出数据预处理的不同,他们可能需要。

两个常见的网络体系结构的例子是卷积神经网络(cnn)和长期短期记忆(LSTM)网络。

美国有线电视新闻网

CNN的核心构件是卷积层。它通过滑动一个过滤器,或者内核,在输入数量和寻找区域被激活。从这些激活区域,CNN学习存在哪些特性,以及在哪些方面的数据。通过结合这些特点,网络可以确定最可能的分类。

LSTM

LSTM网络是一种递归神经网络(RNN),可以学习长期时间步骤的序列数据之间的依赖关系。LSTM网络的核心组件是一个序列的输入层和一个LSTM层。序列输入层提要一个序列就像文本或时间序列数据网络。一层LSTM学习长期时间步骤的序列数据之间的依赖关系。

这两个网络(和大多数其他的),输入固定的元素融入到它的数量和数据所代表的含义。这意味着,如果你收集的数据不一致的大小或数据类型,它需要预处理成一种网络预计。

数据类型

你如何预处理数据取决于你使用的数据类型。这里有一些例子。

表格数据:而深度学习表格数据是不太常见的应用程序,它仍有一些使用。你可能需要的列表表格数据转换为一个稀疏矩阵与一个炎热的编码或与实体嵌入一个密度矩阵。

图片和视频:每张图片你喂到网络需要大小相同的宽度,高度,和颜色层。这可能意味着预处理的一部分是作物,拉长,或调整图像,没有正确的尺寸。

信号:的长度和采样率信号需要一致,或种植,填充,再重采样是必需的。

示例:使用短时傅里叶变换预处理音频信号

这是一个音频波形的一个人说“让这个词。“这是记录在44.1 kHz,长约0.8秒。分类网络预计1秒长的音频信号。第一个在这种情况下预处理步骤是垫与零信号的开始和结束。

最重要的音频内容生成人的声音比8 kHz频率低;因此,该音频信号可以重新取样16赫兹没有损失的信息。

短时傅里叶变换可用于可视化音频信号的频率内容是如何随时间变化。这是通过选择一个窗口大小小于完整的信号,然后运行一个快速傅里叶变换(FFT)的子集数据跳窗在整个信号。

一个窗口函数乘以窗口的数据,以确保它开始和结束为零。这将会消除人工高频信息,介绍了在一个不连续的FFT信号重复。

每个FFT产生成千上万的值在整个频谱。这种级别的粒度不需要认识到单词的音频数据。减少频率信息的一个常见的方法是将频谱划分为许多箱子然后规模和频率在每一本与梅尔过滤器银行。梅尔·滤波器组是一组三角形带通滤波器,在较低的频率间隔紧密,逐步得到更广泛和远随着频率增加。这种类型的过滤器银行模仿人类听觉的敏感性,耳朵是更敏感的频率低于更高的频率。

当梅尔过滤器银行应用于每个窗口光谱,结果是一个单值/三角本代表的频率含量。在下面图片中,本频率内容策划与正方形标记颜色的基于价值。

所有这些信息的频率和时间窗口结合成一个单一的形象:光谱图。谱图预处理的一种方法是时间序列数据转换成图像,可以用作输入到一个卷积神经网络。

了解更多关于预处理和关键字检测