统计和机器学习工具箱

统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

开始:

探索性数据分析

通过统计绘图和交互式图形和描述性统计来探索数据。使用群集标识模式和功能。

可视化

使用概率绘图,箱图,直方图,分位数 - 分位数和多变量分析的高级图来视觉探索数据,例如树木图,总体和安德鲁斯图。

使用多维散点图来探索变量之间的关系。

使用多维散点图来探索变量之间的关系。

描述性统计

通过一些高度相关的数字快速了解和描述潜在的大量数据。

使用分组方式和差异探索数据。

使用分组方式和差异探索数据。

聚类分析

通过使用K-Means,K-METOIDS,DBSCAN,分层和光谱聚类和高斯混合和隐藏的马尔可夫模型进行分组数据来发现模式。

将DBSCAN应用于两个同心组。

将DBSCAN应用于两个同心组。

特征提取和减少维度

将原始数据转换为最适合机器学习的功能。迭代探索并创建新功能,然后选择优化性能的功能。

特征提取

使用无监督的学习技术从数据中提取特征,例如稀疏过滤和重建ICA。您还可以使用专门的技术来提取图像,信号,文本和数字数据的特征。自动生成表格数据的新功能分类回归

从移动设备提供的信号中提取特征。

从移动设备提供的信号中提取特征。

功能选择

自动识别提供最佳预测电源的功能的子集。特征选择方法包括逐步回归,顺序特征选择,正则化和集合方法。

NCA有助于选择保留模型的最精确度的功能。

NCA有助于选择保留模型的最精确度的功能。

特征转化和维度减少

通过将现有(非特异性)特征转换为新的预测变量来减少维度,其中可以丢弃更少的描述性功能。特征转换方法包括PCA,因子分析和非负矩阵分解。

PCA将许多变量投影到一些完全的大部分信息的正交结果上。

PCA可以将高维向量投影到较低尺寸正交坐标系上,其中大部分信息保存。

机器学习

使用互动应用或自动化机器学习(Automl)构建预测分类和回归模型。自动选择功能,识别最佳型号,并调整HyperParameters。通过应用解释性算法解释模型行为。

火车,验证和调谐预测模型

比较各种机器学习算法 - 包括浅层神经网络,选择功能,调整HyperParameters,评估许多流行分类和回归算法的性能。使用互动应用程序构建并自动优化预测模型,逐步改善模型使用流数据。减少标记数据的需求应用半监督学习

模型解释性

通过使用生成添加剂模型(GAM)等固有的可解释模型来增强黑箱机器学习的可解释性,或者通过应用既定的解释性方法,包括部分依赖性地块,个人有条件期望(冰),局部可解释模型 - 不可知解释(石灰),和福利价值观。

石灰在局域建造复杂模型的简单近似。

石灰在局域建造复杂模型的简单近似。

自动化机器学习(Automl)

通过自动调整超参数,生成和选择功能和模型来提高模型性能,以及使用成本矩阵寻址数据集不平衡。

优化贝叶斯优化有效优化的超级参数。

优化贝叶斯优化有效优化的超级参数。

回归和Anova.

模型作为一个或多个预测器的函数,使用线性和非线性回归,混合效果模型,广义线性模型和非参数回归来模拟连续响应变量。使用ANOVA分配给不同源的差异。

线性和非线性回归

许多线性和非线性回归算法中选择多种预测器或响应变量的复杂系统的模型行为。适合多级或分层,线性,非线性和广义的线性混合效应模型,具有嵌套和/或交叉的随机效应,以进行纵向或面板分析,重复测量和生长建模。

与回归学习者应用交互式回归模型。

与回归学习者应用交互式回归模型。

非参数回归

在不指定使用SVM,随机林,浅神经网络,高斯过程和高斯内核之间的预测器和响应之间关系的模型,可以生成准确的拟合。

识别使用大分回归的异常值。

识别使用大分回归的异常值。

方差分析(ANOVA)

将样本方差分配给不同的源,并确定不同人口组中是否出现的变化。使用单向,双向,多路,多变量和非参数Anova,以及协方差分析(Anocova)和反复措施的方差分析(Ranova)。

使用多通物ANOVA的测试组。

使用多通物ANOVA的测试组。

概率分布和假设试验

拟合到数据的分布。分析样品到样本差异是否与随机数据变化很大或一致。从各种分布生成随机数。

概率分布

适合连续和离散的分布,使用统计地块评估适合性的高度,并计算概率密度函数和累积分布函数超过40个不同的分布

使用配送钳工应用交互式配合分布。

使用配送钳工应用交互式配合分布。

随机数生成

从装配或构造的概率分布产生伪随机和准随机数流。

交互式生成随机数。

交互式生成随机数。

假设检验

执行T检验,分配测试(Chi-Square,Jarque-Bera,LipleieFors和Kolmogorov-Smirnov),以及一个,配对或独立样品的非参数测试。测试自动校正和随机性,并比较分布(两个样本Kolmogorov-Smirnov)。

单面T检验中的抑制区域。

单面T检验中的抑制区域。

工业统计数据

统计分析效果和数据趋势。应用工业统计技术,如定制的实验设计和统计过程控制。

实验设计(DOE)

定义,分析和可视化实际实验设计(DOE)。创建和测试如何操作串联中数据输入的实用计划,以生成有关其对数据输出影响的信息。

应用Box-Behnken设计以生成更高阶响应曲面。

应用Box-Behnken设计以生成更高阶响应曲面。

统计过程控制(SPC)

通过评估过程变异性来监测和改进产品或过程下载188bet金宝搏。创建控制图,估算过程能力,并执行量具重复性和再现性研究。

当测量留下过程的控制限制时,控制图在视觉上显示。

使用控制图监控制造过程。

可靠性和生存分析

通过执行COX比例危险回归和拟合分布,可视化和分析故障时间数据和不进行审查。计算经验危害,幸存者和累积分布函数,以及内核密度估计。

失败数据作为“审查”值的示例。

失败数据作为“审查”值的示例。

大数据,并行化和云计算

将统计和机器学习技术应用于内存up-Mement数据。加快统计计算和机器学习模型训练,并行化集群和云实例。

用高阵列分析大数据

使用高阵列和表格具有许多分类,回归和聚类算法,以培训在不换气中不适合内存的数据集上的模型,而无需更改代码。

使用并行计算工具箱或MATLAB并行服务器™加快计算。

使用并行计算工具箱或MATLAB并行服务器™加快计算。

云和分布式计算

使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。

在Amazon或Azure云实例上执行计算。

在Amazon或Azure云实例上执行计算。

部署,代码生成和Simulink集成金宝app

部署统计信息和机器学习到嵌入式系统,使用C代码加速计算密集型计算,并与企业系统和Simulink模型集成。金宝app

代码生成

生成便携式和可读的C或C ++代码,用于推断分类和回归算法,描述性统计和使用Matlab Coder™的概率分布。使用固定点Designer™使用固定点设计器™的精度降低,并在不重新生成预测码的情况下更新部署模型的参数,从而生成C / C ++预测码。

两个部署的路径:生成C代码或编译MATLAB代码。

两个部署的路径:生成C代码或编译MATLAB代码。

与应用程序和企业系统集成

将统计和机器学习模型作为独立,MapReduce或Spark™应用部署;作为Web应用程序;或作为微软®excel.®使用MATLAB COMPILER™加载项。构建C / C ++共享库,Microsoft .NET程序集,Java®课程和python®使用MATLAB编译器SDK™的包。

使用MATLAB编译器整合空气质量分类模型。

使用MATLAB编译器整合空气质量分类模型。

代码生成和模型更新工作流程

代码生成和模型更新工作流程

机器学习ondramp.

机器学习ondramp.

实用机器学习方法的互动介绍。