统计和机器学习工具箱
使用统计和机器学习分析和模拟数据
统计和机器学习工具箱™提供函数和应用程序来描述,分析和模型数据。您可以使用描述性统计,可视化和聚类进行探索数据分析;适合数据的概率分布;为Monte Carlo模拟生成随机数,并执行假设测试。回归和分类算法允许您使用AutomL的分类和回归学习者应用程序绘制从数据和建立预测模型的推广,并使用Automl使用Automl。
对于多维数据分析和特征提取,工具箱提供主成分分析(PCA),正常化,维数减少和特征选择方法,可让您识别具有最佳预测功率的变量。
工具箱提供监督,半监督和无监督机器学习算法,包括支持向量机(SVM),提升决策树,金宝appK均值和其他聚类方法。您可以应用偏依赖性地块和石灰等解释性技术,并自动生成用于嵌入式部署的C / C ++代码。许多工具箱算法可以用于太大的数据集,无法存储在内存中。
开始:
可视化
使用概率绘图,箱图,直方图,分位数 - 分位数和多变量分析的高级图来视觉探索数据,例如树木图,总体和安德鲁斯图。
聚类分析
通过使用K-Means,K-METOIDS,DBSCAN,分层和光谱聚类和高斯混合和隐藏的马尔可夫模型进行分组数据来发现模式。
功能选择
自动识别提供最佳预测电源的功能的子集。特征选择方法包括逐步回归,顺序特征选择,正则化和集合方法。
特征转化和维度减少
通过将现有(非特异性)特征转换为新的预测变量来减少维度,其中可以丢弃更少的描述性功能。特征转换方法包括PCA,因子分析和非负矩阵分解。
模型解释性
通过使用生成添加剂模型(GAM)等固有的可解释模型来增强黑箱机器学习的可解释性,或者通过应用既定的解释性方法,包括部分依赖性地块,个人有条件期望(冰),局部可解释模型 - 不可知解释(石灰),和福利价值观。
自动化机器学习(Automl)
通过自动调整超参数,生成和选择功能和模型来提高模型性能,以及使用成本矩阵寻址数据集不平衡。
线性和非线性回归
许多线性和非线性回归算法中选择多种预测器或响应变量的复杂系统的模型行为。适合多级或分层,线性,非线性和广义的线性混合效应模型,具有嵌套和/或交叉的随机效应,以进行纵向或面板分析,重复测量和生长建模。
非参数回归
在不指定使用SVM,随机林,浅神经网络,高斯过程和高斯内核之间的预测器和响应之间关系的模型,可以生成准确的拟合。
方差分析(ANOVA)
将样本方差分配给不同的源,并确定不同人口组中是否出现的变化。使用单向,双向,多路,多变量和非参数Anova,以及协方差分析(Anocova)和反复措施的方差分析(Ranova)。
概率分布
适合连续和离散的分布,使用统计地块评估适合性的高度,并计算概率密度函数和累积分布函数超过40个不同的分布。
假设检验
执行T检验,分配测试(Chi-Square,Jarque-Bera,LipleieFors和Kolmogorov-Smirnov),以及一个,配对或独立样品的非参数测试。测试自动校正和随机性,并比较分布(两个样本Kolmogorov-Smirnov)。
实验设计(DOE)
定义,分析和可视化实际实验设计(DOE)。创建和测试如何操作串联中数据输入的实用计划,以生成有关其对数据输出影响的信息。
统计过程控制(SPC)
通过评估过程变异性来监测和改进产品或过程下载188bet金宝搏。创建控制图,估算过程能力,并执行量具重复性和再现性研究。
可靠性和生存分析
通过执行COX比例危险回归和拟合分布,可视化和分析故障时间数据和不进行审查。计算经验危害,幸存者和累积分布函数,以及内核密度估计。
用高阵列分析大数据
使用高阵列和表格具有许多分类,回归和聚类算法,以培训在不换气中不适合内存的数据集上的模型,而无需更改代码。
云和分布式计算
使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。
代码生成
生成便携式和可读的C或C ++代码,用于推断分类和回归算法,描述性统计和使用Matlab Coder™的概率分布。使用固定点Designer™使用固定点设计器™的精度降低,并在不重新生成预测码的情况下更新部署模型的参数,从而生成C / C ++预测码。
与Simulink集成金宝app
将机器学习模型与Simulink模型集成,以部署到嵌入式硬件或系统仿真,验证和金宝app验证。
与应用程序和企业系统集成
将统计和机器学习模型作为独立,MapReduce或Spark™应用部署;作为Web应用程序;或作为微软®excel.®使用MATLAB COMPILER™加载项。构建C / C ++共享库,Microsoft .NET程序集,Java®课程和python®使用MATLAB编译器SDK™的包。
产品资源:
机器学习ondramp.
实用机器学习方法的互动介绍。