使用机器学习技术从已知的输入和响应数据建立预测模型

监督学习是最常见的学习方式机器学习算法。它使用一个已知的数据集(称为训练数据集)来训练一个具有一组已知输入数据(称为特征)和已知响应的算法,以进行预测。训练数据集包括与期望输出或响应值配对的带标签的输入数据。监督学习算法通过发现特征和输出数据之间的关系来创建模型,然后预测新数据集的响应值。

在应用监督学习之前,无监督学习通常用于发现输入数据中的模式,这些模式建议候选特征,特征工程将其转换为更适合监督学习。除了识别特征外,还需要为培训集中的所有观察确定正确的类别或响应,这是一个非常劳动密集的步骤。半监督学习允许您使用非常有限的标记数据训练模型,从而减少标记工作。

一旦算法被训练,一个没有被用于训练的测试数据集通常被用来预测算法的性能并验证它。为了获得准确的性能结果,训练和测试集都是“现实”的良好表示(即,来自生产环境和模型的数据都得到了正确验证)是至关重要的。

模型验证问答

您可以在中培训、验证和调整预测监督学习模型MATLAB®具有深度学习工具箱™,统计和机器学习工具箱™。

监督学习算法

分类:用于分类响应值,其中数据可分为特定类。二元分类模型有两类,多类分类模型有更多类。您可以使用MATLAB的classification Learner应用程序训练分类模型。

常见的分类算法包括:

回归:用于数字连续响应值。您可以使用MATLAB的回归学习器应用程序训练回归模型。

常见的回归算法包括:

监督学习应用

监督学习在金融应用中用于信用评分,算法交易和债券分类,用于对象分类和跟踪的图像和视频应用,用于异常检测的工业应用,用于设备寿命估算,用于肿瘤检测和药物发现的生物应用,以及用于价格和价格的能源应用负荷预测

实例

假设您希望预测房价,并拥有房屋销售的历史数据,其中房屋大小、位置和销售年份为特征,实际销售价格为已知响应。这是监督回归的一个很好的用例,您可以自己在这个例子中试试这个方法.下面所示的线性模型的权重是有意义的:房屋的类型和大小,建造年份,以及邻近地区确实决定了房屋的价值。残差图表明线性模型很好地捕捉了变量和价格之间的关系

另见:统计和机器学习工具箱,深度学习工具箱,机器学习,无监督学习,阿达博斯特,线性回归,非线性回归,数据拟合,数据分析,数学建模,预测建模,人工智能,AutoML,正则化

你对机器学习了解多少?