特征提取是指将原始数据转化为可以进行处理的数字特征,同时保留原始数据集中的信息的过程。它比直接将机器学习应用于原始数据产生更好的结果。
特征提取可以手动或自动完成:
- 手动特征提取需要识别和描述与给定问题相关的特征,并实现提取这些特征的方法。在许多情况下,对背景或领域有良好的了解可以帮助做出明智的决定,哪些特性可能是有用的。经过几十年的研究,工程师和科学家已经开发出图像、信号和文本的特征提取方法。一个简单特征的例子是信号中窗口的平均值。
- 自动特征提取使用专门的算法或深度网络从信号或图像中自动提取特征,不需要人工干预。当你想从原始数据快速转移到开发机器学习算法时,这种技术非常有用。小波散射是自动特征提取的一个例子。
随着深度学习的兴起,特征提取在很大程度上已被深度网络的第一层所取代,但主要用于图像数据。对于信号和时间序列应用,特征提取仍然是第一个挑战,在建立有效的预测模型之前需要大量的专业知识。
信号和时间序列数据的特征提取
特征提取识别信号中最有区别的特性,其中机器学习或深度学习算法可以更容易地消耗。由于高数据速率和信息冗余,培训机器学习或深度学习通常会产生差的结果。
对于开发状态监测和预测性维护应用程序的工程师来说诊断功能设计应用程序在预测维护工具箱™让您提取,可视化和等级功能以设计监控机器健康的条件指示灯。
自动特征提取方法
从信号中自动提取特征的高级方法已经出现。自编码器、小波散射和深度神经网络常用来提取数据的特征和降维。
小波散射网络自动提取实际值时间序列和图像数据的低方差特征。该方法产生数据表示,其最小化了类内的差异,同时保留跨类的判别性。当您没有大量数据开始时,小波散射效果很好。
图像数据的特征提取
图像数据的特征提取表示图像的有趣部分作为紧凑型特征向量。在过去,这是通过专用特征检测,特征提取和特征匹配算法完成的。如今,深度学习在图像和视频分析中普遍存在,已知其能够将原始图像数据作为输入进行,跳过特征提取步骤。无论您采取哪种方法,计算机视觉应用程序,如图像登记,对象检测和分类以及基于内容的图像检索,都需要有效地表示图像特征 - 无论是深度网络的第一层,还是显式应用一些长期以来的图像特征提取技术。