机器学习模型

用参数和非参数模型表示数据

在实践中,“应用机器学习”意味着对数据应用一种算法,该算法创建一个捕获数据趋势的模型。有许多不同类型的机器学习模型可供选择,每种模型都有自己的特点,这可能使其或多或少适合给定的数据集。

这一页提供了不同类型的机器学习模型的概述监督学习; 也就是说,对于我们建立模型来预测响应的问题。在监督学习中,有两类模型:回归(当响应是连续的)和分类(当响应属于一组类时)。

流行的回归机器学习模型

模型 形象 工作原理 MATLAB函数 进一步阅读
线性回归 线性回归是一种统计建模技术,用于将连续响应变量描述为一个或多个预测变量的线性函数。由于线性回归模型易于解释和训练,因此它们通常是第一个适合新数据集的模型。 fitlm

什么是线性回归模型?(文件)

拟合线性回归机器学习模型(代码示例)

非线性回归

非线性回归是一种统计建模技术,有助于描述实验数据中的非线性关系。非线性回归模型通常被假定为参数化的,其中模型被描述为非线性方程。

“非线性”是指一个拟合函数,它是参数的非线性函数。例如拟合参数为b0, b1, b2:方程y = b0+b1x + b2x2是拟合参数的线性函数,而y = (b0xb1) / (x + b2)是拟合参数的非线性函数。

fitnlm

非线性回归(文件)

非线性回归机器学习模型的拟合(代码示例)

高斯过程回归(GPR)

GPR模型是用于预测连续响应变量值的非参数机器学习模型。

响应变量建模为高斯过程,使用输入变量的协方差。

这些模型被广泛地应用于空间分析领域中存在不确定性的插值问题。GPR也被称为Kriging。

菲特尔格普

高斯过程回归模型(文件)

高斯过程机器学习模型的拟合(代码示例)

金宝app支持向量机回归 支持向量机回归算法的工作原理与支持向量机分类算法类似,但经过修改后能够预测连续响应。支持向量机回归算法不是寻找一个分离数据的超平面,而是寻找一个与测量数据偏差不大于一个小值的模型,参数值尽可能小(以最小化对错误的敏感性)。 fitrsvm

理解支持向量机回归金宝app(文件)

拟合支持向量机机器学习模型(代码示例)

广义线性模型 广义线性模型是使用线性方法的非线性模型的一种特殊情况。它包括将输入的线性组合拟合到输出的非线性函数(链接函数)中。 fitglm

广义线性模型(文件)

拟合广义线性模型(代码示例)

回归树 用于回归的决策树与用于分类的决策树相似,但它们被修改以能够预测连续响应。 菲特里

越来越多的决策树(文件)

拟合回归树机器学习模型(代码示例)

神经网络

(浅)

受人类大脑的启发,神经网络由高度连接的神经元网络组成,将输入与期望的输出联系起来。通过反复修改连接的强度来训练网络,使训练输入映射到训练响应。 菲特网

神经网络结构(文件)

神经网络机器学习模型的拟合(代码示例)

神经网络(Deep) 深度神经网络比浅神经网络有更多的隐藏层,有些情况下有数百个隐藏层。深度神经网络可以通过在网络的末端放置回归输出层来解决回归问题。 列车网络

MATLAB中的深度学习(文件)

拟合深度神经网络进行回归(代码示例)

回归树集合体 在集成方法中,几个“较弱”的回归树被组合成一个“较强”的集成。最终的模型使用来自“较弱”回归树的预测组合来计算最终的预测。 fitrensemble

集成算法(文件)

拟合回归树集成机器学习模型(代码示例)

流行的分类机器学习模型

模型 形象 工作原理 MATLAB函数 进一步阅读
逻辑回归 逻辑回归是一种可以预测二元响应属于一类或另一类的概率的模型。由于其简单性,逻辑回归通常被用作二元分类问题的起点。 fitglm

广义线性模型(文件)

Logistic回归机器学习模型的拟合(代码示例)

决策树 决策树允许您通过从根(开始)开始跟踪树中的决策来预测对数据的响应向下至叶节点。树由分支条件组成,其中预测值的值与经过训练的权重进行比较。分支数和权重值在训练过程中确定。可以使用额外的修改或修剪来简化模型。 菲茨特里

越来越多的决策树(文件)

拟合决策树机器学习模型(代码示例)

k最近邻(kNN) kNN是一种机器学习模型,它根据数据集中最近邻的类别对对象进行分类。kNN的预测假设彼此靠近的物体是相似的。距离度量,如欧几里得、城市街区、余弦和切比雪夫,被用来寻找最近的邻居。 菲茨康

使用最近邻进行分类(文件)

拟合k近邻机器学习模型(代码示例)

金宝app支持向量机(SVM) 支持向量机通过寻找线性决策边界(超平面)来分类数据,该边界将一类数据点与另一类数据点分开。当数据是线性可分的时候,支持向量机的最佳超平面是两个类之间最大的超平面。如果数据不是线性可分的,则使用损失函数惩罚超平面错误一侧的点。支持向量机有时使用核变换将非线性可分数据转换为高维,在高维中可以找到线性决策边界。 fitcsvm

金宝app二值分类的支持向量机(文件)

拟合支持向量机机器学习模型(代码示例)

神经网络(浅层) 受人脑启发,神经网络由高度连接的神经元网络组成,这些神经元将输入与期望的输出联系起来。机器学习模型通过迭代修改连接的强度来训练,以便给定的输入映射到正确的响应。神经网络的输入层和输出层之间的神经元被称为“隐藏层”。浅层神经网络通常有一到两个隐藏层。 fitcnet

神经网络结构(文件)

拟合浅神经网络机器学习模型(代码示例)

神经网络(Deep) 深度神经网络比浅神经网络有更多的隐藏层,有些情况下有数百个隐藏层。深度神经网络可以通过在网络的末端放置分类输出层来解决分类问题。许多pretrained深度学习模型对于分类,可公开用于以下任务:图像识别 列车网络

MATLAB中的深度学习(文件)

深度神经网络分类模型的拟合(代码示例)

袋装和增强决策树

在这些集成方法中,几个“较弱”的决策树被组合成一个“较强”的集成。

袋装决策树由独立于从输入数据引导的数据训练的树组成。

提升包括通过反复添加“弱”学习者和调整每个“弱”学习者的权重来创建强学习者,以专注于错误分类的示例。

fitcensemble

集成算法(文件)

拟合增强决策树集合(代码示例)

朴素贝叶斯 朴素贝叶斯分类器假设类中某个特定特征的存在与任何其他特征的存在无关。它根据新数据属于某个特定类别的最高概率对其进行分类。 fitcnb

朴素贝叶斯分类(文件)

拟合朴素贝叶斯机器学习模型(代码示例)

判别分析集合体 判别分析通过寻找特征的线性组合对数据进行分类。判别分析假设不同的类别产生基于高斯分布的数据。训练一个判别分析模型需要为每一类找到高斯分布的参数。分布参数用于计算边界,边界可以是线性函数或二次函数。这些边界用于确定新数据的类别。 fitcdiscr

建立判别分析模型(文件)

拟合判别分析机器学习模型(代码示例)

参见:什么是线性回归?非线性回归金宝app支持向量机卷积神经网络长短期记忆(LSTM)网络监督学习