使用机器学习技术构建来自已知输入和响应数据的预测模型

监督学习是最常见的类型机器学习算法。它使用已知的DataSet(称为训练数据集)来训练具有已知一组输入数据(称为特征)和已知响应的算法,以便进行预测。训练数据集包括标记的输入数据,该输入数据与所需的输出或响应值配对。从它来看,监督学习算法试图通过发现特征和输出数据之间的关系来创建模型,然后使新数据集的响应值预测。

在申请监督学习之前,无人监督的学习经常用于发现建议候选功能的输入数据中的模式,并且特征工程将它们转换为更适合受监管的学习。除了识别特征外,还需要针对培训集中的所有观察确定的正确类别或响应,这是一个非常劳动密集型的步骤。半监督学习允许您使用非常有限的标记数据训练模型,从而减少标签努力。

Once the algorithm is trained, a test dataset, which hasn’t been used for training, is typically used to predict the performance of the algorithm and validate it. To obtain accurate performance results, it is critical that both the training and test set are a good representation of “reality”( i.e., data from the production environment and the model were both validated correctly).

问答模型验证

您可以培训,验证和调整预测性监督学习模型马铃薯®深度学习工具箱™那and统计和机器学习工具箱™.

监督学习算法类别

分类:用于分类响应值,其中数据可以分成特定类。二进制分类模型具有两个类,多字符分类模型更多。您可以使用MATLAB与分类学习者应用培训分类模型。

常见的分类算法包括:

Regression:用于数值连续响应值。您可以使用Matlab与回归学习者应用程序培训回归模型。

常见的回归算法包括:

监督学习应用程序

监督学习用于金融应用credit scoring,算法交易和债券分类,在对象分类和视频应用中,在对象分类和跟踪中,在工业应用中进行异常值检测,在预测性维护中life of equipment estimates,在肿瘤检测和药物发现的生物应用中,以及价格和价格的能源应用load forecasting

让我们假设您希望预测房价,并在与房屋统一,地点和作为特征销售的情况下拥有历史数据,以及作为已知反应的实际销售价格。这是监督回归的优秀用例,你可以try this out yourself in this example。The weights of a linear model shown below make sense: type and size of home, year built, and neighborhood indeed determine home values. The residual plot indicates the linear model captures the relationship between variables and price reasonably well

也可以看看:统计和机器学习工具箱深度学习工具箱机器学习无人监督的学习adaboost.线性回归非线性回归数据配件数据分析mathematical modeling预测建模人工智能自动化regularization

你对机器学习了解多少?