统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

统计和机器学习工具箱

使用统计和机器学习分析和模拟数据

Statistics and Machine Learning Toolbox™提供了描述、分析和建模数据的功能和应用程序。您可以使用描述性统计和图进行探索性数据分析,拟合数据的概率分布,为蒙特卡罗模拟生成随机数,并执行假设检验。回归和分类算法可以让你从数据中推断并建立预测模型。

对于多维数据分析,统计和机器学习工具箱提供功能选择,逐步回归,主成分分析(PCA),正常化和其他维度减少方法,可让您识别影响您的模型的变量或功能。

该工具箱提供了监督和无监督的机器学习算法,包括支持向量机(SVM),提升和袋装决策树,K-最近邻居,K均值,K-METOIDS,分层聚类,高斯混合模型和隐藏的马尔可夫模型。金宝app许多统计和机器学习算法可用于计算太大的数据集上,该数据集太大而无法存储在存储器中。

开始:

探索性数据分析

通过交互式图形和描述性统计的统计绘图探索数据。使用集群识别模式和特性。

可视化

使用概率绘图,盒子图,直方图,分位数 - 分位数和多变量分析的高级绘图探索数据,例如树木图,双针和安德鲁斯图。

使用多维散点图探索变量之间的关系。

描述性统计

使用一些高度相关的数字快速了解并描述潜在的大量数据。

使用分组方式和差异探索数据。

聚类分析

通过使用k-means、k-medoids、DBSCAN、层次聚类、高斯混合和隐马尔可夫模型对数据进行分组,发现模式。

将DBSCAN应用于两个同心组。

特征提取和减少维度

将原始数据转换为最适合机器学习的特征。迭代地探索和创建新特性,并选择能够优化性能的特性。

特征提取

使用无监督的学习技术从数据中提取特征,例如稀疏过滤和重建ICA。您还可以使用专门的技术来提取图像,信号,文本和数字数据的特征。

从移动设备提供的信号中提取特征。

特征选择

自动识别提供最佳预测电源的功能子集,可以在建模数据中。特征选择方法包括逐步回归,顺序特征选择,正则化和集合方法。

NCA帮助选择保持模型大部分准确性的特征。

特征转换和减少维度

通过将现有的(非分类的)特征转换为新的预测变量来降低维数,在这些预测变量中可以去掉较少的描述性特征。特征变换方法包括主成分分析、因子分析和非负矩阵分解。

PCA将许多变量项目投影到一些完全的大部分信息的正交结果上。

机器学习

使用互动应用构建预测分类和回归模型。通过优化HyperParameters自动选择功能和调谐模型。

火车,验证和曲调预测模型

比较各种机器学习算法,选择功能,调整超参数,评估预测性能。使用交互式应用程序构建和自动优化预测模型。

分类

模拟分类响应变量作为一个或多个预测器的函数。使用各种参数和非参数分类算法,包括Logistic回归,SVM,增强和袋装决策树,天真贝叶斯,判别分析和K-Etcembers。

与分类学习者应用交互式培训分类器。

自动模型优化

通过自动调优超参数、选择特性和用成本矩阵解决数据集不平衡问题来提高模型性能。

优化贝叶斯优化有效地优化超级参数。

回归和Anova.

模型作为一个或多个预测器的函数,使用线性和非线性回归,混合效果模型,广义线性模型和非参数回归来模拟连续响应变量。使用ANOVA分配给不同源的差异。

线性和非线性回归

许多线性和非线性回归算法选择多个预测器或响应变量的复杂系统的模型行为。适合多级或分层,线性,非线性和广义的线性混合效应模型,具有嵌套和/或交叉的随机效应,以进行纵向或面板分析,重复测量和生长建模。

与回归学习者应用交互式回归模型。

非参数回归

在不指定描述预测器和响应之间的关系的情况下生成准确的拟合,包括SVM,随机林,高斯过程和高斯内核。

识别使用大分回归的异常值。

方差分析(ANOVA)

将样本方差分配给不同的源,并确定各种群体中是否出现在不同人群中。使用单向,双向,多路,多变量和非参数ANOVA,以及协方差分析(ANOCOVA)和反复措施的方差分析(RANOVA)。

使用多道ANOVA的测试组。

概率分布和假设试验

拟合到数据的分布。分析样品到样本差异是否具有显着或与随机数据变化一致。生成各种分布的随机数。

概率分布

拟合连续和离散分布,使用统计地块评估适合性的高度,并计算概率密度函数和累积分布函数超过40种不同的分布

使用分配钳工应用交互式配合分布。

随机数生成

从拟合或构造的概率分布生成伪随机和准随机数字流。

交互式生成随机数。

假设检验

执行T检验,分配测试(Chi-Square,Jarque-Bera,Lipleiefors和Kolmogorov-Smirnov),以及一个,配对或独立样品的非参数测试。测试自动鼠标和随机性,以及比较分布(两个样本Kolmogorov-Smirnov)。

在单面T检验中的抑制区域。

工业统计数据

统计分析效果和数据趋势。应用工业统计技术,如定制的实验设计和统计过程控制。

实验设计(DOE)

定义,分析和可视化实际设计设计(DOE)。创建和测试如何操纵串联中数据输入的实用计划,以生成有关其对数据输出影响的信息。

应用Box-Behnken设计以生成更高阶响应曲面。

统计过程控制(SPC)

通过评估过程可变性来监测和改进产品或过程下载188bet金宝搏。创建控制图,估算过程能力,并执行量具重复性和再现性研究。

使用控制图监控制造过程。

可靠性和生存分析

通过执行Cox比例风险回归和拟合分布来可视化和分析有和没有审查的失效时间数据。计算经验危险,幸存者,累积分布函数,和核密度估计。

失败数据作为“审查”值的示例。

规模到大数据和云

将统计和机器学习技术应用于内存up-Mement数据。加快统计计算和机器学习模型培训簇和云实例。

用高数组分析大数据

使用带有许多分类、回归和聚类算法的高数组和表,在不改变代码的情况下,在不适合内存的数据集上训练模型。

使用并行计算工具箱或MATLAB并行服务器™加快计算。

云计算和分布式计算

使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。

在Amazon或Azure云实例上执行计算。

部署和代码生成

将统计信息和机器学习部署到嵌入式系统,使用C代码加速计算密集型计算,并与企业系统集成。

代码生成

生成可移植和可读的C或c++代码,用于推断分类和回归算法,描述性统计,和概率分布使用MATLAB编码器TM值。使用MATLAB功能块和系统块使用机器学习模型加速验证和验证您的高保真仿真。

两种部署路径:生成C代码或编译MATLAB代码。

与应用程序和企业系统集成

独立部署统计和机器学习模型、MapReduce、Spark™应用程序、web应用程序和微软®excel.®使用Matlab Compiler™的加载项。构建C / C ++共享库,Microsoft .NET程序集,Java®课程和python®使用Matlab Compiler SDK™的包。

使用MATLAB编译器整合空气质量分类模型。

更新已部署的模型

更新已部署模型的参数,无需重新生成C / C ++预测代码。

代码生成和模型更新工作流程。

最新的特性

自动化机器学习(Automl)

自动选择最佳型号和相关的超参数以进行分类(fitcauto.

特征选择

使用卡方检验对特征进行排序(FSCCHI2.)分类和F-Tests(FSRFTEST.)用于回归问题

代码生成

使用All-Numeric表预测(需要MATLAB编码器)

代码生成

为决策树生成定点C / C ++代码,决策树的集合(需要MATLAB编码器和定点设计师)

GPU支金宝app持

加速corr随机的和32通过在GPU上执行(需要并行计算工具箱)的概率分布函数

看看发布说明有关这些功能的详细信息和相应的功能。

机器学习斜坡弯道

实用机器学习方法的互动介绍。