数据预处理用于训练、验证和推断。预处理由一系列的确定性操作组成,这些操作可以规范化或增强所需的数据特征。例如,您可以将数据规范化到一个固定的范围,或者将数据缩放到网络输入层所需的大小。
预处理可以在深度学习工作流的两个阶段进行。
通常,预处理作为一个单独的步骤发生,在准备将数据提交到网络之前完成。加载原始数据,应用预处理操作,然后将结果保存到磁盘。这种方法的优点是预处理开销只需要一次,然后预处理的图像就可以很容易地作为将来训练网络的所有试验的起点。
方法将数据加载到数据存储中,那么还可以在训练期间应用预处理变换
而且结合
功能。有关更多信息,请参见用于深度学习的数据存储.转换后的图像不存储在内存中。如果预处理操作的计算成本不高,并且不会显著影响网络训练的速度,那么这种方法可以方便地避免将训练数据的第二份副本写入磁盘。
数据增强由随机操作组成,这些随机操作在网络进行训练时应用于训练数据。增广增加了训练数据的有效量,有助于使网络不受数据中常见失真的影响。例如,可以在训练数据中添加人工噪声,使网络对噪声不变。
要扩充训练数据,首先要将数据加载到数据存储中。有关更多信息,请参见用于深度学习的数据存储.一些内置数据存储对特定应用程序的数据应用特定的、有限的扩展集。方法,还可以对数据存储中的数据应用自己的扩充操作集变换
而且结合
功能。在训练过程中,数据存储随机扰动每个epoch的训练数据,以便每个epoch使用稍微不同的数据集。
增加图像数据以模拟图像采集中的变化。例如,最常见的图像增强操作类型是几何变换,如旋转和平移,这模拟相机方向相对于场景的变化。颜色抖动模拟场景中照明条件和颜色的变化。人工噪声模拟传感器中的电波动和模数转换误差引起的畸变。模糊模拟失焦镜头或相机相对于场景的运动。
常见的图像预处理操作包括噪声去除、边缘保持平滑、颜色空间转换、对比度增强和形态学。
如果您有图像处理工具箱™,那么您可以使用这些操作以及工具箱中的任何其他功能来处理数据。有关显示如何创建和应用这些转换的示例,请参见使用图像处理工具箱为深度学习工作流增加图像.
处理类型 | 描述 | 样品的功能 | 样例输出 |
---|---|---|---|
调整图像 | 通过固定的缩放因子或目标大小调整图像的大小 |
|
|
扭曲的图像 | 对图像应用随机反射、旋转、缩放、剪切和平移 |
|
|
作物图像 | 将图像从中心或随机位置裁剪到目标大小 |
|
|
抖动的颜色 | 随机调整图像色调、饱和度、亮度或对比度 |
|
|
模拟噪声 | 添加随机高斯,泊松,盐和胡椒,或乘噪声 |
|
|
模拟模糊 | 添加高斯或方向运动模糊 |
|
|
对象检测数据由图像和描述图像中对象的位置和特征的边界框组成。
如果您有计算机视觉工具箱™,那么您可以使用图片标志(计算机视觉工具箱)和贴标签机视频(计算机视觉工具箱)应用程序交互标记roi,并导出标签数据以训练神经网络。如果您有自动驾驶工具箱™,那么您也可以使用地面真相标签(自动驾驶工具箱)应用程序创建标签地面真相训练数据。
在转换图像时,必须对相应的边界框执行相同的转换。如果有“计算机视觉工具箱”,则可以使用表中的操作处理边界框数据。有关显示如何创建和应用这些转换的示例,请参见增加对象检测的边界框.有关更多信息,请参见开始使用深度学习进行对象检测(计算机视觉工具箱).
处理类型 | 描述 | 样品的功能 | 样例输出 |
---|---|---|---|
调整边框的大小 | 按固定的缩放因子或目标大小调整边界框的大小 |
|
|
裁剪边框 | 将边界框从中心或随机位置裁剪到目标大小 |
|
|
曲速边界箱 | 对边框应用反射、旋转、缩放、剪切和平移 |
|
|
语义分割数据由图像和对应的像素标签组成,以分类数组的形式表示。
如果您有计算机视觉工具箱,那么您可以使用图片标志(计算机视觉工具箱)和贴标签机视频(计算机视觉工具箱)应用程序交互标记像素和导出标签数据训练神经网络。如果您有“自动驾驶工具箱”,那么您也可以使用地面真相标签(自动驾驶工具箱)应用程序创建标签地面真相训练数据。
在转换图像时,必须对相应的像素标记图像执行相同的转换。如果有“图像处理工具箱”,则可以使用表中的函数和支持分类输入的任何其他工具箱函数对像素标签图像进行预处理。金宝app有关显示如何创建和应用这些转换的示例,请参见增强像素标签的语义分割.有关更多信息,请参见开始使用深度学习进行语义分割(计算机视觉工具箱).
处理类型 | 描述 | 样品的功能 | 样例输出 |
---|---|---|---|
调整像素标签的大小 | 通过固定的缩放因子或目标大小调整像素标签图像的大小 |
|
|
裁剪像素标签 | 将像素标签图像从中心或随机位置裁剪为目标大小 |
|
|
翘曲像素标签 | 对像素标签图像应用随机反射、旋转、缩放、剪切和平移 |
|
|
信号处理工具箱™使您能够去噪,平滑,趋势和重采样信号。可以使用噪声、多径衰落和合成信号(如脉冲和啁啾)来增强训练数据。方法还可以创建标记的信号集信号贴标签机(信号处理工具箱)App和labeledSignalSet
(信号处理工具箱)对象。有关显示如何创建和应用这些转换的示例,请参见基于深度学习的波形分割.
小波工具箱™和信号处理工具箱使您能够生成时间序列数据的二维时频表示,您可以将其用作信号分类应用程序的图像输入。示例请参见用小波分析和深度学习对时间序列进行分类.同样,可以从信号数据中提取序列,用作LSTM网络的输入。示例请参见利用长短时记忆网络对心电信号进行分类(信号处理工具箱).
通信工具箱™扩展了信号处理功能,使您能够执行通信系统的错误校正、交错、调制、滤波、同步和均衡。有关显示如何创建和应用这些转换的示例,请参见基于深度学习的调制分类.
您可以使用表中的函数以及每个工具箱中的任何其他功能处理信号数据。
处理类型 | 描述 | 样品的功能 | 样例输出 |
---|---|---|---|
干净的信号 |
|
|
|
滤波器的信号 |
|
|
|
增强信号 |
|
|
|
创建时间-频率表示 | 创建一维信号的谱图、尺度图和其他二维表示 |
|
|
从信号中提取特征 | 估计瞬时频率和谱熵 |
|
Audio Toolbox™提供了音频处理、语音分析和声学测量的工具。使用这些工具提取听觉特征和转换音频信号。增加音频数据随机或确定的时间缩放,时间拉伸,和音高移动。方法还可以创建标记的基本真理训练数据音频贴标签机(音频工具箱)您可以使用该表中的函数以及工具箱中的任何其他功能处理音频数据。有关显示如何创建和应用这些转换的示例,请参见扩充音频数据集(音频工具箱).
处理类型 | 描述 | 样品的功能 | 样例输出 |
---|---|---|---|
增加音频数据 | 执行随机或确定的音调移动,时间尺度修改,时间移动,噪声添加和音量控制 |
|
|
提取音频特征 | 从音频片段中提取频谱参数 |
|
处理输出: ans = struct with fields: mfcc: [1 23 4 5 6 7 8 9 10 11 12 13] mfccDelta: [14 15 16 17 18 19 20 21 22 23 24 25 26] mfccDeltaDelta: [27 28 29 30 31 32 33 34 35 36 37 38 39] spectralCentroid: 40 pitch: 41 |
创建时间-频率表示 | 创建mel声谱图和音频信号的其他二维表示 |
|
|
文本分析工具箱™包括处理来自设备日志、新闻提要、调查、运营商报告和社交媒体等源的原始文本的工具。使用这些工具可以从流行的文件格式中提取文本、预处理原始文本、提取单个单词或多词短语(n-grams)、将文本转换为数字表示以及构建统计模型。可以使用此表中的函数以及工具箱中的任何其他功能处理文本数据。有关如何开始的示例,请参见为分析准备文本数据(文本分析工具箱).
处理类型 | 描述 | 样品的功能 | 样例输出 |
---|---|---|---|
标记文本 | 将文本解析为单词和标点符号 |
|
原:
处理输出:
|
干净的文字 |
|
|
处理输出:
|
结合
|读
|trainingOptions
|trainNetwork
|变换