统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

下载免费试用

查看定价

统计和机器学习工具箱™提供函数和应用程序来描述，分析和模型数据。您可以使用描述性统计，可视化和聚类进行探索数据分析;适合数据的概率分布;为Monte Carlo模拟生成随机数，并执行假设测试。回归和分类算法允许您使用AutomL的分类和回归学习者应用程序绘制从数据和建立预测模型的推广，并使用Automl使用Automl。

对于多维数据分析和特征提取，工具箱提供主成分分析（PCA），正常化，维数减少和特征选择方法，可让您识别具有最佳预测功率的变量。

工具箱提供监督，半监督和无监督机器学习算法，包括支持向量机（SVM），提升决策树，金宝appK均值和其他聚类方法。您可以应用偏依赖性地块和石灰等解释性技术，并自动生成用于嵌入式部署的C / C ++代码。许多工具箱算法可以用于太大的数据集，无法存储在内存中。

开始：

什么是统计和机器学习工具箱？

探索性数据分析

通过统计绘图和交互式图形和描述性统计来探索数据。使用群集标识模式和功能。

可视化

使用概率绘图，箱图，直方图，分位数 - 分位数和多变量分析的高级图来视觉探索数据，例如树木图，总体和安德鲁斯图。

可视化多变量数据

可用统计图概述

Boxplot用于分组数据

使用随机邻居嵌入可视化高维数据

使用多维散点图来探索变量之间的关系。

描述性统计

通过一些高度相关的数字快速了解和描述潜在的大量数据。

描述性统计概述

按类别分组的摘要统计信息

处理缺失值的数据

使用内核平滑功能的密度估计

使用分组方式和差异探索数据。

聚类分析

通过使用K-Means，K-METOIDS，DBSCAN，分层和光谱聚类和高斯混合和隐藏的马尔可夫模型进行分组数据来发现模式。

集群分析概述

以交互方式探索K-meast群集

基于密度的噪声应用的空间聚类（DBSCAN）

使用Laplacian分数的无监督学习的等级功能

将DBSCAN应用于两个同心组。

特征提取和减少维度

将原始数据转换为最适合机器学习的功能。迭代探索并创建新功能，然后选择优化性能的功能。

特征提取

使用无监督的学习技术从数据中提取特征，例如稀疏过滤和重建ICA。您还可以使用专门的技术来提取图像，信号，文本和数字数据的特征。自动生成表格数据的新功能分类和回归。

特征提取工作流程

信号和图像的特征提取

文本数据准备与文本分析工具箱™

使用深度学习功能的图像分类

从移动设备提供的信号中提取特征。

功能选择

自动识别提供最佳预测电源的功能的子集。特征选择方法包括逐步回归，顺序特征选择，正则化和集合方法。

使用邻域分量分析（NCA）进行分类检测特征

使用最小冗余最大相关性（MRMR）分类的等级功能

选择用于分类高维数据的功能

通过应用正则化防止过度装备

NCA有助于选择保留模型的最精确度的功能。

特征转化和维度减少

通过将现有（非特异性）特征转换为新的预测变量来减少维度，其中可以丢弃更少的描述性功能。特征转换方法包括PCA，因子分析和非负矩阵分解。

MATLAB中维数减少和特征变换技术概述

使用PCA分析美国城市的生活质量

了解功能转换和选择技术

PCA可以将高维向量投影到较低尺寸正交坐标系上，其中大部分信息保存。

机器学习

使用互动应用或自动化机器学习（Automl）构建预测分类和回归模型。自动选择功能，识别最佳型号，并调整HyperParameters。通过应用解释性算法解释模型行为。

火车，验证和调谐预测模型

比较各种机器学习算法 - 包括浅层神经网络，选择功能，调整HyperParameters，评估许多流行分类和回归算法的性能。使用互动应用程序构建并自动优化预测模型，逐步改善模型使用流数据。减少标记数据的需求应用半监督学习。

在回归学习者应用程序中火车回归模型

回归学习者应用程序（3:42）

MATLAB用于数据分析（3:55）

建设和评估预测模型的最佳实践

使用ROC曲线评估分类模型（4:43）

无监督异常检测的各种技术

使用分类学习者应用程序对数据进行分类

模型解释性

通过使用生成添加剂模型（GAM）等固有的可解释模型来增强黑箱机器学习的可解释性，或者通过应用既定的解释性方法，包括部分依赖性地块，个人有条件期望（冰），局部可解释模型 - 不可知解释（石灰），和福利价值观。

Matlab中的解释概述

应用部分依赖性地块（PDP）和个人有条件期望（ICE）曲线到回归

Matlab的模型解释性（5:49）

本地可解释模型 - 不可知的解释（石灰）

在Matlab中应用福利值

用于不同分类器的决策曲面

石灰在局域建造复杂模型的简单近似。

自动化机器学习（Automl）

通过自动调整超参数，生成和选择功能和模型来提高模型性能，以及使用成本矩阵寻址数据集不平衡。

什么是automl？

自动模型选择和封立参数优化在一步中

HyperParameter优化解释了（4:43）

贝叶斯优化工作流程

快速自动模型选择ASHA优化

优化贝叶斯优化有效优化的超级参数。

回归和Anova.

模型作为一个或多个预测器的函数，使用线性和非线性回归，混合效果模型，广义线性模型和非参数回归来模拟连续响应变量。使用ANOVA分配给不同源的差异。

线性和非线性回归

许多线性和非线性回归算法中选择多种预测器或响应变量的复杂系统的模型行为。适合多级或分层，线性，非线性和广义的线性混合效应模型，具有嵌套和/或交叉的随机效应，以进行纵向或面板分析，重复测量和生长建模。

将回归分析应用于NYC住房数据

描述非线性关系

使用MATLAB的多级混合效应建模（34:44）

了解广义线性模型

与回归学习者应用交互式回归模型。

非参数回归

在不指定使用SVM，随机林，浅神经网络，高斯过程和高斯内核之间的预测器和响应之间关系的模型，可以生成准确的拟合。

适合并优化支持向量机（SVM）回归模型金宝app

通过回归随机森林预测保险风险

了解高斯进程回归

使用量级回归检测异常值

识别使用大分回归的异常值。

方差分析（ANOVA）

将样本方差分配给不同的源，并确定不同人口组中是否出现的变化。使用单向，双向，多路，多变量和非参数Anova，以及协方差分析（Anocova）和反复措施的方差分析（Ranova）。

单向ANOVA简介

了解多种比较

多道ANOVA用于平衡和不平衡数据（N-WAY ANOVA）

使用多通物ANOVA的测试组。

概率分布和假设试验

拟合到数据的分布。分析样品到样本差异是否与随机数据变化很大或一致。从各种分布生成随机数。

概率分布

适合连续和离散的分布，使用统计地块评估适合性的高度，并计算概率密度函数和累积分布函数超过40个不同的分布。

使用配电钳安装模型数据

可用概率分布

从多变量分布计算，适合或生成样本

拟合自定义单变量分布

使用配送钳工应用交互式配合分布。

随机数生成

从装配或构造的概率分布产生伪随机和准随机数流。

以交互方式生成随机数

生成准随机数

了解蒙特卡罗模拟

使用Copulas模拟依赖变量

交互式生成随机数。

假设检验

执行T检验，分配测试（Chi-Square，Jarque-Bera，LipleieFors和Kolmogorov-Smirnov），以及一个，配对或独立样品的非参数测试。测试自动校正和随机性，并比较分布（两个样本Kolmogorov-Smirnov）。

假设检测介绍

单面或双面T检验：测试比例或相关性

执行两个样本T检验

Chi-Square良好测试

单面T检验中的抑制区域。

工业统计数据

统计分析效果和数据趋势。应用工业统计技术，如定制的实验设计和统计过程控制。

实验设计（DOE）

定义，分析和可视化实际实验设计（DOE）。创建和测试如何操作串联中数据输入的实用计划，以生成有关其对数据输出影响的信息。

系统数据收集计划实验简介

响应表面设计，包括Box-Behnken

应用Box-Behnken设计以生成更高阶响应曲面。

统计过程控制（SPC）

通过评估过程变异性来监测和改进产品或过程下载188bet金宝搏。创建控制图，估算过程能力，并执行量具重复性和再现性研究。

控制图表简介

使用六种Sigma技术的设计改进发动机冷却风扇

使用控制图监控制造过程。

可靠性和生存分析

通过执行COX比例危险回归和拟合分布，可视化和分析故障时间数据和不进行审查。计算经验危害，幸存者和累积分布函数，以及内核密度估计。

审查经验分布和最大似然估计

Cox比例危险模型与时间依赖的协变量

使用Kaplan-Meier估算累积危害，幸存者和累积分布

使用Cox比例危险模型估算重新入学

用审查分析终身数据

失败数据作为“审查”值的示例。

大数据，并行化和云计算

将统计和机器学习技术应用于内存up-Mement数据。加快统计计算和机器学习模型训练，并行化集群和云实例。

用高阵列分析大数据

使用高阵列和表格具有许多分类，回归和聚类算法，以培训在不换气中不适合内存的数据集上的模型，而无需更改代码。

使用高阵列的大数据集模型飞行延迟

支持高阵列的功能概述金宝app

Caterpillar的大数据，数据分析和机器/深层学习基础设施（18:47）

Matlab高大阵列在行动中

并行计算

加快并行化统计计算和模型训练。

并行化计算机学习与并行计算工具箱™的简介

了解如何在MATLAB中加快计算

Matlab与R基准

matlab与python.^®：选择matlab的最佳原因

使用并行计算工具箱或MATLAB并行服务器™加快计算。

云和分布式计算

使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。

访问AWS和Azure上的云实例^®使用MATLAB参考架构

在您的Web浏览器中访问MATLAB

访问nvidia上的云实例^®GPU云

在Amazon或Azure云实例上执行计算。

部署，代码生成和Simulink集成金宝app

部署统计信息和机器学习到嵌入式系统，使用C代码加速计算密集型计算，并与企业系统和Simulink模型集成。金宝app

代码生成

生成便携式和可读的C或C ++代码，用于推断分类和回归算法，描述性统计和使用Matlab Coder™的概率分布。使用固定点Designer™使用固定点设计器™的精度降低，并在不重新生成预测码的情况下更新部署模型的参数，从而生成C / C ++预测码。

代码生成工作流程概述

使用编码器应用生成机器学习模型的C代码

更新代码生成的模型参数

为SVM预测生成固定点C / C ++

系统对象™分类和代码生成

两个部署的路径：生成C代码或编译MATLAB代码。

与Simulink集成金宝app

将机器学习模型与Simulink模型集成，以部署到嵌入式硬件或系统仿真，验证和金宝app验证。

在Simulink中集成SVM预测金宝app^®使用本机块

在Simulink中整合浅神经网络金宝app

在Simulink中应用机器学习金宝app^®使用MATLAB功能块

Simulink library for machine learning with native blocks for SVM prediction.

" data-toggle="lightbox" class="fluid_link">

金宝app用于机器学习的Simulink库，具有用于SVM预测的本机块。

与应用程序和企业系统集成

将统计和机器学习模型作为独立，MapReduce或Spark™应用部署;作为Web应用程序;或作为微软^®excel.^®使用MATLAB COMPILER™加载项。构建C / C ++共享库，Microsoft .NET程序集，Java^®课程和python^®使用MATLAB编译器SDK™的包。

与MATLAB的数据分析（53:40）

在智能手机上部署人类活动认可

单键部署到MATLAB生产服务器