Bernhard Suhm, MathWorks
获取AutoML的概述,以及它如何简化机器学习工作流。学习如何通过三步建立优化的预测模型:
该视频演示了如何应用AutoML来构建人类活动的分类器,并使用来自移动设备的传感器数据作为输入。
MATLAB中的AutoML只需要三个步骤就可以提供优化的模型。首先,使用波长散射将原始传感器数据转换为机器学习需要的特征作为输入。接下来,自动特征选择允许您减少大型特征集,从而最终减少模型大小。最后,自动模型选择为您选择最佳模型,并在同一步骤中优化其超参数。您可以在没有机器学习专业知识的情况下应用这些步骤。然而,这个视频使用了一些技术术语来解释幕后发生的事情。
我们演示了autoML使用来自移动电话的加速计元数据构建一个模型来分类活动,比如站立或坐着。视频的其余部分将带你了解MATLAB中的autoML步骤。首先,为了从信号或图像数据中获得相关的特征,您可以使用预定义的小波和矩阵函数的尺度滤波器对信号进行波长分解,将小波散射应用于信号的缓冲区。
接下来,我们可以继续在我们获得的400多个特征上训练一个模型,但这可能会导致一个不适合嵌入式设备的大型模型。auoML的第二步,我们应用特征选择来减少特征的数量。这里的表格帮助您根据数据的特征选择合适的方法。
在这里,我们应用了最小冗余最大关联算法,它在连续和分类特征上工作得很好。特征排名表表明,只有十几个特征捕获了信号的大部分可变性。
在选择一小部分性能特征集之后,我们可以进行第三步——确定最佳性能模型。使用fitcauto进行分类和适配[?自动回归。我们只训练我们在前一步中选择的十几个特性。该算法评估了许多模型和超参数的组合,以寻求最小化误差。在实践中,这可能需要数百次迭代才能完全收敛。尽管对于中等大小的数据,我们可以在更短的时间内看到良好的结果,大约100次迭代。您可以使用多个核上的并行化、本地计算机上的并行化或使用云实例来加速执行。
将autoML应用于该数据集,我们得到了一个对保留测试数据具有96.6%准确性的模型。总之,autoML在几个步骤中就获得了一个高度精确的模型,有效地允许工程师自己构建模型,而无需依赖数据科学家。如果您精通机器学习,autoML可以节省您在常规步骤上的时间,使您能够专注于高级优化技术,如堆叠模型和设计更好的功能。欲了解更多信息,请访问我们的autoML发现页面或下面的链接。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。