主要内容

机器学习在MATLAB

什么是机器学习?

机器学习教计算机做人类天生擅长的事:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预先确定的方程作为模型。随着可供学习的样本数量的增加,算法自适应地提高了它们的性能。

机器学习使用两种技术:监督学习,即在已知的输入和输出数据上训练模型,以便预测未来的输出;非监督学习,即在输入数据中发现隐藏的模式或内在结构。

监督机器学习的目的是建立一个模型,在存在不确定性的情况下,根据证据进行预测。监督学习算法采用已知的输入数据集和已知的对数据(输出)的响应,并训练模型生成对新数据响应的合理预测。监督学习使用分类和回归技术来开发预测模型。

  • 分类技术可以预测明确的回复,例如,电子邮件是真实的还是垃圾邮件,肿瘤是癌变的还是良性的。分类模型将输入数据分类。典型的应用包括医学成像、图像和语音识别以及信用评分。

  • 回归技术预测连续响应,例如温度的变化或电力需求的波动。典型的应用包括电力负荷预测和算法交易。

无监督学习发现数据中隐藏的模式或内在结构。它用于从没有标记响应的输入数据组成的数据集中得出推论。聚类是最常见的无监督学习技术。它用于探索性数据分析,以发现数据中的隐藏模式或分组。聚类的应用包括基因序列分析、市场研究和对象识别。

选择正确的算法

选择正确的算法似乎是不可避免的——有数十种有监督和无监督的机器学习算法,每一种都采用不同的学习方法。没有最好的方法,也没有一刀切的办法。找到正确的算法在一定程度上是建立在反复试验的基础上的——即使是经验丰富的数据科学家也无法在不进行试验的情况下判断算法是否可行。高度灵活的模型倾向于通过建模可能是噪声的微小变化来过度拟合数据。简单的模型更容易解释,但精确度可能较低。因此,选择正确的算法需要权衡利弊,包括模型速度、准确性和复杂性。试错是机器学习的核心——如果一种方法或算法不起作用,你就尝试另一种。MATLAB®提供工具,以帮助您尝试各种机器学习模型和选择最好的。

要找到MATLAB应用程序和函数来帮助你解决机器学习任务,请参考下表。一些机器学习任务通过使用应用程序变得更容易,还有一些使用命令行功能。

任务 MATLAB应用与函数 产品 了解更多
分类来预测分类反应

使用分类学习者应用程序自动训练选择的模型,并帮助您选择最好的。您可以生成MATLAB代码来使用脚本。

要获得更多选项,可以使用命令行界面。

统计和机器学习工具箱™

在分类学习者应用程序中训练分类模型

分类功能

预测连续反应的回归

使用回归学习者应用程序自动训练选择的模型,并帮助您选择最好的。您可以生成MATLAB代码来处理脚本和其他函数选项。

要获得更多选项,可以使用命令行界面。

统计和机器学习工具箱

在回归学习者应用程序中训练回归模型

回归函数

聚类 使用聚类分析功能。 统计和机器学习工具箱 聚类分析
计算金融任务,如信用评分 使用工具建模信用风险分析。 金融工具箱™和风险管理工具箱™ 信用风险(金融工具箱)
深度学习与神经网络分类和回归 使用预先训练好的网络和函数来训练卷积神经网络。 深度学习工具箱™ MATLAB中的深度学习(深度学习工具箱)
人脸识别,运动检测,物体检测 使用深度学习工具进行图像处理和计算机视觉。 深度学习工具箱和计算机视觉工具箱™ 识别、目标检测和语义分割(计算机视觉工具箱)

以下系统的机器学习工作流可以帮助您解决机器学习的挑战。您可以在MATLAB中完成整个工作流。

要将训练最好的模型集成到生产系统中,您可以使用Statistics和Machine Learning Toolbox部署机器学习模型MATLAB编译器™.对于许多模型,您可以使用c代码生成预测MATLAB编码器™

在分类学习者应用程序中训练分类模型

使用Classification Learner应用程序训练模型使用有监督的机器学习对数据进行分类。该应用程序允许你使用各种分类器交互式地探索有监督的机器学习。

  • 自动训练选择的模型,以帮助您选择最佳的模型。模型类型包括决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯、核近似、集成和神经网络分类器。金宝app

  • 探索数据、指定验证方案、选择特性并可视化结果。默认情况下,应用程序通过应用交叉验证来防止过拟合。或者,您可以选择拒绝验证。验证结果帮助您为数据选择最佳模型。图表和性能度量反映了经过验证的模型结果。

  • 将模型导出到工作区,以使用新数据进行预测。除了使用指定的验证方案的模型外,该应用程序总是使用完整数据训练模型,而完整模型就是您导出的模型。

  • 从应用程序生成MATLAB代码来创建脚本,使用新数据训练,使用巨大的数据集,或修改代码以进行进一步分析。

想要了解更多,请看在分类学习者应用程序中训练分类模型

要获得更多选项,可以使用命令行界面。看到分类

在回归学习者应用程序中训练回归模型

使用回归学习应用程序训练模型,使用有监督的机器学习来预测连续数据。该应用程序可以让你使用各种回归模型交互式地探索有监督的机器学习。

  • 自动训练选择的模型,以帮助您选择最佳的模型。模型类型包括线性回归模型、回归树、高斯过程回归模型、支持向量机、回归树集合和神经网络回归模型。金宝app

  • 探索您的数据,选择功能,并可视化结果。与分类学习器相似,回归学习器默认使用交叉验证。结果和可视化反映了验证的模型。使用结果为您的数据选择最佳模型。

  • 将模型导出到工作区,以使用新数据进行预测。除了使用指定的验证方案的模型外,该应用程序总是使用完整数据训练模型,而完整模型就是您导出的模型。

  • 从应用程序生成MATLAB代码来创建脚本,使用新数据训练,使用巨大的数据集,或修改代码以进行进一步分析。

想要了解更多,请看在回归学习者应用程序中训练回归模型

要获得更多选项,可以使用命令行界面。看到回归

为深度学习训练神经网络

深度学习工具箱使您能够使用卷积神经网络进行深度学习,用于分类、回归、特征提取和迁移学习。工具箱提供了简单的MATLAB命令,用于创建和连接深层神经网络的各层。示例和预先训练的网络使使用MATLAB进行深度学习变得容易,即使不具备先进的计算机视觉算法或神经网络的广泛知识。

想要了解更多,请看MATLAB中的深度学习(深度学习工具箱)

相关的话题