自动化构建优化的机器学习模型的过程

自动化的机器学习(AutoML)自动化和消除手动步骤需要从数据准备好去预测模型。AutoML也降低了专业技术水平要求建立精确的模型,所以你可以使用它无论你是一个专家或具有有限的机器学习经验。重复的任务自动化,简化AutoML在机器学习工作流程复杂的阶段,如:

  • 数据探查和预处理:确定预测能力低且高度相关的应被剔除的变量。
  • 特征提取与选择:提取自动和特点 - 大量的功能集之中 - 找出那些具有较高的预测能力。
  • 模型选择和调整:自动调整模型超参数,并确定性能最佳的模型。
  • 准备部署:通过代码生成,您可以将高级机器学习代码转换为低级语言,如C/ c++,以便部署在内存有限、功耗较低的嵌入式设备上。

图1:AutoML流线机器学习工作流程。其中AutoML适用步骤以浅灰色显示。

可以使用MATLAB和AutoML支持许多工作流,比如特征提取和选择金宝app、模型选择和调优。

特征提取与选择

特征提取减少了原始数据中存在的高维性和可变性,并识别了捕获输入信号的显著和独特部分的变量。特征工程的过程通常是从原始数据生成初始特征到选择最合适特征的一个子集。但特征工程是一个迭代的过程,特征变换和降维等方法可以起到一定的作用。

根据数据的类型,可以使用许多方法从原始数据生成特性:

  • 小波散射应用预定义的小波和尺度滤波器,从信号和图像数据中获得低方差特征。
  • 无监督学习方法重建ICA稀疏的过滤,通过揭示独立的成分和优化特征分布的稀疏性来学习有效的表示。
  • 其他功能图片和音频信号可以在“计算机视觉工具箱™”和“音频工具箱™”中找到。

特性选择标识了仍然提供预测能力的特性子集,但是特性更少,模型更小。各种各样的用于自动特性选择的方法,包括根据预测能力对特征进行排序,以及学习特征的重要性和模型参数。其他特征选择方法迭代地确定一组优化模型性能的特征。

模型选择和调整

开发全面的机器学习模型的核心是在众多可用的模型中确定哪个模型最适合当前的任务,然后调整其超参数以优化性能。AutoML可以在单个步骤中优化模型和相关超参数。一步模型优化的高效实现元学习缩小搜索申请好模型的一个子集候选人模型基于特征的功能,并优化每个候选人的hyperparameters模型有效地运用贝叶斯优化的计算更密集的网格和随机搜索。

如果使用其他方法(如尝试和错误)来识别有希望的模型,则可以通过网格或随机搜索或前面提到的贝叶斯优化等方法对其超参数进行单独优化。

一旦你已经确定了性能模型,可以不用额外的编码部署优化模型。为了完成这个任务,应用的自动代码生成,或者它内部的模拟环境,比如Simulink的整合金宝app®

参见:统计和机器学习工具箱,机器学习,监督式学习,特征提取,特征选择,数据拟合,小波变换,小波工具箱