特征提取

机器学习和深度学习功能提取

特征提取是指将原始数据转换为可以在保留原始数据集中的信息的同时处理的数字特征的过程。它产生的结果比将机器学习直接应用于原始数据产生了更好的结果

特征提取可以手动或自动完成:

  • 手动功能提取需要识别和描述与给定问题相关的功能,并实现提取这些功能的方法。在许多情况下,对背景或域具有良好的理解,可以有助于对哪些功能有用的明智决策。几十年的研究,工程师和科学家已经开发了用于图像,信号和文本的特征提取方法。一个简单特征的示例是信号中窗口的平均值。
  • 自动特征提取使用专用算法或深网络来自动从信号或图像中提取特征,而无需人为干预。当您希望将从原始数据快速移动到开发机器学习算法时,此技术非常有用。小波散射是自动特征提取的一个例子。

随着深度学习的上升,特征提取基本上由第一层的深网络层替换 - 但主要用于图像数据。对于信号和时间序列应用,功能提取仍然是在可以构建有效的预测模型之前需要重要专业知识的第一个挑战。

信号和时间序列数据的特征提取

特征提取识别信号中最有区别的特性,其中机器学习或深度学习算法可以更容易地消耗。由于高数据速率和信息冗余,培训机器学习或深度学习通常会产生差的结果。

将特征提取应用于机器学习分类器的信号和时间序列数据的示意工艺。

信号特征和时频变换

在分析信号和传感器数据时,信号处理工具箱™小波工具箱™提供允许您在时间,频率和时频域中测量信号的公共独特特征的功能。您可以应用脉冲和过渡度量,测量信噪比(SNR),估计光谱熵和峰度,以及计算功率谱。

时间频率变换,例如短时傅里叶变换(STFT)可以用作机器学习和深度学习模型中的数据的信号表示。例如,卷积神经网络(CNNS)通常用于图像数据,并且可以成功地从时频变换返回的2D信号表示中学习。

使用短时傅里叶变换的信号的谱图。谱图显示频率内容随时间的变化。

根据具体应用或特性,还可以使用其他时频变换。例如,常数q变换(CQT)提供了对数间隔频率分布;连续小波变换通常能有效地识别非平稳信号中的短暂瞬态。

音频应用的功能和预测性维护

音频工具箱™提供了一系列时频变换,包括MEL谱图,八度音程和伽马托滤波器组,以及通常用于音频,语音和声学的离散余弦变换(DCT)。其他流行的特征提取方法对于这些类型的信号包括MEL频率谱系数(MFCC),γ谱系系数(GTCC),音高,谐波和不同类型的音频谱描述符。这音频特征提取器工具可以帮助从同一源信号中选择和提取不同的音频功能,同时重用任何中间计算以获得效率。

对于工程师开发条件监测和预测维护的应用,诊断功能设计器应用程序预测维护工具箱™让您提取,可视化和等级功能以设计监控机器健康的条件指示灯。

诊断功能设计器应用程序可让您设计和比较功能以区分标称和故障系统。

自动特征提取方法

新的高级方法已经出现自动从信号中提取特征。AutoEncoders,小波散射和深神经网络通常用于提取特征并减少数据的维度。

小波散射网络自动提取实际值时间序列和图像数据的低方差特征。该方法产生数据表示,其最小化了类内的差异,同时保留跨类的判别性。当您没有大量数据开始时,小波散射效果很好。

图像数据的功能提取

图像数据的特征提取表示图像的有趣部分作为紧凑型特征向量。在过去,这是通过专用特征检测,特征提取和特征匹配算法完成的。如今,深度学习在图像和视频分析中普遍存在,已知其能够将原始图像数据作为输入进行,跳过特征提取步骤。无论您采取哪种方法,计算机视觉应用程序,如图像登记,对象检测和分类以及基于内容的图像检索,都需要有效地表示图像特征 - 无论是深度网络的第一层,还是显式应用一些长期以来的图像特征提取技术。

使用特征检测,特征提取和匹配的组合检测杂乱场景(右)中的物体(左)。有关详细信息,请参阅示例。

提供特征提取技术计算机Vision Toolbox™图像处理工具箱™包括:

  • 导向梯度的直方图(猪)
  • 加速强大的功能(冲浪)
  • 本地二进制模式(LBP)功能

成导梯度的直方图(HOG)特征提取图像(顶部)。创建不同大小的特征向量,以通过不同的单元格大小(底部)表示图像。有关详细信息,请参阅示例。

也可以看看:特色匹配对象检测图像稳定化图像处理和计算机视觉图像识别对象检测对象识别数字图像处理光流量ransac.模式识别点云深度学习功能选择

机器学习培训课程

在本课程中,您将确定如何使用无监督的学习技术来发现大数据集中的功能和监督的学习技术来构建预测模型。