自动构建优化的机器学习模型的过程

自动化的机器学习(AutoML)自动化和消除手动步骤需要从数据准备好去预测模型。AutoML也降低了专业技术水平要求建立精确的模型,所以你可以使用它无论你是一个专家或具有有限的机器学习经验。重复的任务自动化,简化AutoML在机器学习工作流程复杂的阶段,如:

  • 数据探索和预处理:确定与低的预测能力,并应当消除高度相关的变量,变量。
  • 特征提取与选择:提取自动和特点 - 大量的功能集之中 - 找出那些具有较高的预测能力。
  • 模型选择和调整:自动调节模式超参数和识别表现最好的模型。
  • 准备部署:代码生成,可以改造高级别机器学习代码转换成低级语言如C / C ++对具有有限的存储器和低功耗的嵌入式设备部署。

图1:AutoML流线机器学习工作流程。其中AutoML适用步骤以浅灰色显示。

您可以使用MATLAB与AutoML支持许多工作流程,如特征提取和选金宝app择和模型的选择和调整。

特征提取与选择

特征提取减少了原始数据,并且识别变量捕获的显着和输入信号的独特份的高维数和变异存在。特征工程的过程典型地从产生从原始数据初始特征于选择的最适合的特征的小的子集进行。但功能设计是一个反复的过程,和其他方法,如特征变换和降维能起到一定的作用。

根据数据的类型,很多方法可用来从原始数据的特点:

  • 小波散射适用预先定义小波和缩放滤波器,以获得低方差从信号和图像数据的功能。
  • 无监督学习方法,如重建ICA稀疏过滤,通过揭露独立的组件,并在特征分布稀疏优化学习效率表示。
  • 其他功能图片和音频信号可以在计算机视觉工具箱™和音频工具箱™被发现。

特征选择识别功能仍提供预测能力,但功能较少和较小的模型的一个子集。各个用于自动特征选择方法可供选择,包括通过他们的预测能力分级特征,并与模型参数一起学习功能的重要性。其他特征选择方法反复确定一组功能,优化模型的性能。

模型选择和调整

在制定一个全面的机器学习模型识别其手头上的许多可用的模型进行最适合的任务中,然后调整其超参数来优化性能的核心。AutoML可以在单一步骤中同时优化模型和相关联的超参数。的一个步骤模型优化高效的实现使用元学习缩小了良好的模型基础上的功能特性候选模型的一个子集搜索,并优化超参数为每个候选模型的有效运用贝叶斯优化,而不是计算的更密集的网格和随机搜索。

如果希望的模型使用其他手段(例如,试验和错误)确定,其超参数可以单独通过方法如网格或随机搜索,或贝叶斯优化如前所述优化。

一旦你已经确定了性能模型,可以不用额外的编码部署优化模型。为了完成这个任务,应用的自动代码生成,或者它内部的模拟环境,比如Simulink的整合金宝app®

也可以看看:统计和机器学习工具箱机器学习监督学习特征提取特征选择数据拟合小波变换小波工具箱