特征提取是指将原始数据转换为可以在保留原始数据集中的信息的同时处理的数字特征的过程。它产生的结果比将机器学习直接应用于原始数据产生了更好的结果.
功能提取可以手动或自动完成:
- 手动功能提取需要识别和描述与给定问题相关的功能,并实现提取这些功能的方法。在许多情况下,对背景或域具有良好的理解,可以有助于对哪些功能有用的明智决策。几十年的研究,工程师和科学家已经开发了用于图像,信号和文本的特征提取方法。一个简单特征的示例是信号中窗口的平均值。
- 自动特征提取使用专用算法或深网络来自动从信号或图像中提取特征,而无需人为干预。当您希望将从原始数据快速移动到开发机器学习算法时,此技术非常有用。小波散射是自动特征提取的一个例子。
随着深度学习的上升,特征提取基本上由第一层的深网络层替换 - 但主要用于图像数据。对于信号和时间序列应用,功能提取仍然是在可以构建有效的预测模型之前需要重要专业知识的第一个挑战。
信号和时间序列数据的特征提取
特征提取识别信号中最具辨别力的特征,机器学习或深度学习算法更容易使用这些特征。由于高数据率和信息冗余,直接使用原始信号进行机器学习或深度学习的训练结果往往很差。
对于工程师开发条件监测和预测维护的应用,诊断功能设计器应用程序在预测性维护工具箱™允许您提取、可视化和排列功能,以设计用于监视机器运行状况的条件指示器。
自动特征提取方法
新的高级方法已经出现自动从信号中提取特征。AutoEncoders,小波散射和深神经网络通常用于提取特征并减少数据的维度。
小波散射网络自动从实值时间序列和图像数据中提取低方差特征。这种方法生成的数据表示可以最小化类内的差异,同时保持类间的可区分性。小波散射在没有大量数据的情况下工作良好。
图像数据的功能提取
图像数据的特征提取将图像中感兴趣的部分表示为一个紧凑的特征向量。在过去,这是通过专门的特征检测、特征提取和特征匹配算法实现的。如今,深度学习在图像和视频分析中非常流行,它能够将原始图像数据作为输入,跳过特征提取步骤。无论采用哪种方法,计算机视觉应用(如图像注册、对象检测和分类以及基于内容的图像检索)都需要有效地表示图像特征——或者通过深层网络的第一层隐式表示,或者明确应用一些长期存在的图像特征提取技术。
提供特征提取技术计算机Vision Toolbox™和图像处理工具箱™包括:
- 导向梯度的直方图(猪)
- 加速强大的功能(冲浪)
- 本地二进制模式(LBP)功能