统计和机器学习工具箱

Statistics and Machine Learning Toolbox™提供了描述、分析和建模数据的功能和应用程序。您可以使用描述性统计和图进行探索性数据分析，拟合数据的概率分布，为蒙特卡罗模拟生成随机数，并执行假设检验。回归和分类算法可以让你从数据中推断并建立预测模型。

对于多维数据分析，统计和机器学习工具箱提供功能选择，逐步回归，主成分分析（PCA），正常化和其他维度减少方法，可让您识别影响您的模型的变量或功能。

该工具箱提供了监督和无监督的机器学习算法，包括支持向量机（SVM），提升和袋装决策树，K-最近邻居，K均值，K-METOIDS，分层聚类，高斯混合模型和隐藏的马尔可夫模型。金宝app许多统计和机器学习算法可用于计算太大的数据集上，该数据集太大而无法存储在存储器中。

最新的特性
文档和资源
尝试或购买

免费电子书：
掌握机器学习：使用MATLAB逐步指南

现在就下载

探索性数据分析

通过交互式图形和描述性统计的统计绘图探索数据。使用集群识别模式和特性。

可视化

使用概率绘图，盒子图，直方图，分位数 - 分位数和多变量分析的高级绘图探索数据，例如树木图，双针和安德鲁斯图。

可视化多变量数据

可用统计图概述

Boxplot for分组数据

使用随机邻居嵌入可视化高维数据

使用多维散点图探索变量之间的关系。

描述性统计

使用一些高度相关的数字快速了解并描述潜在的大量数据。

描述性统计概述

汇总统计按类别分组

处理缺失值的数据

使用内核平滑功能的密度估计

使用分组方式和差异探索数据。

聚类分析

通过使用k-means、k-medoids、DBSCAN、层次聚类、高斯混合和隐马尔可夫模型对数据进行分组，发现模式。

聚类分析概述

基于密度的噪声应用的空间聚类（DBSCAN）

使用K-Means发现基因表达谱

使用高斯混合模型的集群

将DBSCAN应用于两个同心组。

特征提取和减少维度

将原始数据转换为最适合机器学习的特征。迭代地探索和创建新特性，并选择能够优化性能的特性。

特征提取

使用无监督的学习技术从数据中提取特征，例如稀疏过滤和重建ICA。您还可以使用专门的技术来提取图像，信号，文本和数字数据的特征。

特征提取工作流程

具有计算机视觉工具箱™和图像处理工具箱™的图像的功能提取

用信号处理工具箱™的信号提取功能

文本数据准备与文本分析工具箱™

使用深度学习功能进行图像分类

从移动设备提供的信号中提取特征。

特征选择

自动识别提供最佳预测电源的功能子集，可以在建模数据中。特征选择方法包括逐步回归，顺序特征选择，正则化和集合方法。

选择用于分类高维数据的功能

通过应用正则化防止过拟合

顺序特征选择

使用邻域分量分析（NCA）进行分类检测特征

NCA帮助选择保持模型大部分准确性的特征。

特征转换和减少维度

通过将现有的(非分类的)特征转换为新的预测变量来降低维数，在这些预测变量中可以去掉较少的描述性特征。特征变换方法包括主成分分析、因子分析和非负矩阵分解。

MATLAB中维数减少和特征变换技术概述^®

使用PCA分析美国城市的生活质量

了解功能转换和选择技术

PCA将许多变量项目投影到一些完全的大部分信息的正交结果上。

机器学习

使用互动应用构建预测分类和回归模型。通过优化HyperParameters自动选择功能和调谐模型。

火车，验证和曲调预测模型

比较各种机器学习算法，选择功能，调整超参数，评估预测性能。使用交互式应用程序构建和自动优化预测模型。

分类学习者应用程序

回归学习者应用程序

MATLAB用于数据分析(55分钟)

建立和评估预测模型的最佳实践

4:34

使用分类学习者应用对数据进行分类

分类

模拟分类响应变量作为一个或多个预测器的函数。使用各种参数和非参数分类算法，包括Logistic回归，SVM，增强和袋装决策树，天真贝叶斯，判别分析和K-Etcembers。

在浏览器中尝试分类学习者应用程序

基于随机森林的手写识别

使用ROC曲线评估分类模型(43)

用于不同分类器的决策曲面

与分类学习者应用交互式培训分类器。

自动模型优化

通过自动调优超参数、选择特性和用成本矩阵解决数据集不平衡问题来提高模型性能。

覆盖物优化解释了(43)

贝叶斯优化工作流程

使用NCA进行回归的强大功能选择

在一步中自动化模型选择和封立参数优化

什么是automl？

优化贝叶斯优化有效地优化超级参数。

回归和Anova.

模型作为一个或多个预测器的函数，使用线性和非线性回归，混合效果模型，广义线性模型和非参数回归来模拟连续响应变量。使用ANOVA分配给不同源的差异。

线性和非线性回归

许多线性和非线性回归算法选择多个预测器或响应变量的复杂系统的模型行为。适合多级或分层，线性，非线性和广义的线性混合效应模型，具有嵌套和/或交叉的随机效应，以进行纵向或面板分析，重复测量和生长建模。

在回归学习者应用程序中火车回归模型

描述非线性关系

使用MATLAB的多级混合效应建模（34:44）

了解广义线性模型

与回归学习者应用交互式回归模型。

非参数回归

在不指定描述预测器和响应之间的关系的情况下生成准确的拟合，包括SVM，随机林，高斯过程和高斯内核。

拟合和优化支持向量机(SVM)回归模型金宝app

用回归随机森林预测保险风险

学习高斯过程回归

使用量级回归检测异常值

识别使用大分回归的异常值。

方差分析（ANOVA）

将样本方差分配给不同的源，并确定各种群体中是否出现在不同人群中。使用单向，双向，多路，多变量和非参数ANOVA，以及协方差分析（ANOCOVA）和反复措施的方差分析（RANOVA）。

单向ANOVA简介

了解多种比较

多道Anova用于平衡和不平衡数据（N-Way Anova）

使用多道ANOVA的测试组。

概率分布和假设试验

拟合到数据的分布。分析样品到样本差异是否具有显着或与随机数据变化一致。生成各种分布的随机数。

概率分布

拟合连续和离散分布，使用统计地块评估适合性的高度，并计算概率密度函数和累积分布函数超过40种不同的分布。

使用配送钳工应用程序的模型数据

可用概率分布

从多变量分布计算，适合或生成样本

拟合定制单变量分布

使用分配钳工应用交互式配合分布。

随机数生成

从拟合或构造的概率分布生成伪随机和准随机数字流。

交互式生成随机数

生成准随机数

了解蒙特卡罗模拟

使用Copulas模拟依赖变量

交互式生成随机数。

假设检验

执行T检验，分配测试（Chi-Square，Jarque-Bera，Lipleiefors和Kolmogorov-Smirnov），以及一个，配对或独立样品的非参数测试。测试自动鼠标和随机性，以及比较分布（两个样本Kolmogorov-Smirnov）。

假设检测介绍

单面或双面t检验：测试比例或相关性

执行两个样本T检验

Chi-Square良好的测试

在单面T检验中的抑制区域。

工业统计数据

统计分析效果和数据趋势。应用工业统计技术，如定制的实验设计和统计过程控制。

实验设计（DOE）

定义，分析和可视化实际设计设计（DOE）。创建和测试如何操纵串联中数据输入的实用计划，以生成有关其对数据输出影响的信息。

系统数据收集规划实验简介

响应表面设计，包括Box-Behnken

应用Box-Behnken设计以生成更高阶响应曲面。

统计过程控制（SPC）

通过评估过程可变性来监测和改进产品或过程下载188bet金宝搏。创建控制图，估算过程能力，并执行量具重复性和再现性研究。

控制图简介

使用六种Sigma技术的设计改进发动机冷却风扇

使用控制图监控制造过程。

可靠性和生存分析

通过执行Cox比例风险回归和拟合分布来可视化和分析有和没有审查的失效时间数据。计算经验危险，幸存者，累积分布函数，和核密度估计。

具有时变协变量的Cox比例风险模型

使用Kaplan-Meier估算累积危害，幸存者和累积分布

使用Cox比例危险模型估算重新招生

用审查分析终身数据

失败数据作为“审查”值的示例。

规模到大数据和云

将统计和机器学习技术应用于内存up-Mement数据。加快统计计算和机器学习模型培训簇和云实例。

用高数组分析大数据

使用带有许多分类、回归和聚类算法的高数组和表，在不改变代码的情况下，在不适合内存的数据集上训练模型。

使用高阵列的大数据集模型飞行延迟

支持高阵列的功能概述金宝app

Caterpillar的大数据，数据分析和机器/深层学习基础设施（18:47）

4:13

Matlab高大阵列在行动中

并行计算

并行化加快统计计算和模型训练。

并行计算工具箱™并行化机器学习简介

了解如何在MATLAB中加快计算

Matlab与R基准

MATLAB与Python^®基准

使用并行计算工具箱或MATLAB并行服务器™加快计算。

云计算和分布式计算

使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。

访问AWS和Azure上的云实例^®使用MATLAB参考架构

在您的Web浏览器中访问MATLAB联机

访问nvidia上的云实例^®GPU云

在Amazon或Azure云实例上执行计算。

部署和代码生成

将统计信息和机器学习部署到嵌入式系统，使用C代码加速计算密集型计算，并与企业系统集成。

代码生成

生成可移植和可读的C或c++代码，用于推断分类和回归算法，描述性统计，和概率分布使用MATLAB编码器^TM值。使用MATLAB功能块和系统块使用机器学习模型加速验证和验证您的高保真仿真。

代码生成工作流程概述

使用编码器应用生成机器学习模型的C代码

用于分类和代码生成的系统对象™

在Simulink中应用机器学习金宝app^®使用MATLAB功能块

两种部署路径:生成C代码或编译MATLAB代码。

与应用程序和企业系统集成

独立部署统计和机器学习模型、MapReduce、Spark™应用程序、web应用程序和微软^®excel.^®使用Matlab Compiler™的加载项。构建C / C ++共享库，Microsoft .NET程序集，Java^®课程和python^®使用Matlab Compiler SDK™的包。

在Web应用程序中部署电力负载预测模型

在智能手机上部署人类活动识别

使用MATLAB编译器整合空气质量分类模型。

更新已部署的模型

更新已部署模型的参数，无需重新生成C / C ++预测代码。

更新代码生成的模型参数

使用编码器配置器生成预测和更新的代码

代码生成和模型更新工作流程。

使用统计和机器学习分析和模拟数据

统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

开始：

免费电子书：掌握机器学习：使用MATLAB逐步指南

探索性数据分析

可视化

描述性统计

聚类分析

特征提取和减少维度

特征提取

特征选择

特征转换和减少维度

机器学习

火车，验证和曲调预测模型

分类

自动模型优化

回归和Anova.

线性和非线性回归

非参数回归

方差分析（ANOVA）

概率分布和假设试验

概率分布

随机数生成

假设检验

工业统计数据

实验设计（DOE）

统计过程控制（SPC）

可靠性和生存分析

规模到大数据和云

用高数组分析大数据

并行计算

云计算和分布式计算

部署和代码生成

代码生成

与应用程序和企业系统集成

更新已部署的模型

最新的特性

自动化机器学习（Automl）

特征选择

代码生成

代码生成

GPU支金宝app持

机器学习斜坡弯道

额外的统计和机器学习工具箱资源

免费试用

准备买？

你是学生吗？

免费电子书：
掌握机器学习：使用MATLAB逐步指南