统计和机器学习工具
分析和模型数据使用统计和机器学习
统计和机器学习工具箱™提供功能和应用程序来描述、分析和模型数据。您可以使用描述性统计、可视化和聚类的探索性数据分析;适合数据概率分布;生成随机数的蒙特卡罗模拟,并执行假设测试。回归和分类算法让你从数据得出结论并建立预测模型交互,使用分类和回归学习者应用程序,或者通过编程,使用AutoML。
多维数据分析和特征提取,工具箱提供了主成分分析(PCA),正规化,降维,特征选择方法,让你识别变量与最好的预测能力。
工具箱提供了监督、semi-supervised和非监督机器学习算法,包括支持向量机(svm),提高了决策树金宝app,k - means,和其他聚类方法。您可以应用可解释性等技术部分依赖情节和石灰,并自动生成C / c++代码为嵌入式部署。许多工具箱算法可用于数据集太大被存储在内存中。
开始:
可视化
使用概率图,直观地探索数据盒阴谋,直方图,quantile-quantile情节,和先进的地块进行多变量分析,如系统树图,biplots,安德鲁斯的情节。
聚类分析
发现模式通过使用k - means分组数据、k-medoids DBSCAN,层次和谱聚类和高斯混合隐马尔可夫模型。
特征选择
自动识别的特征子集提供最好的预测能力的建模数据。特征选择方法包括逐步回归、序列特征选择,正规化,合奏的方法。
功能转换和降维
减少维度通过将现有的(non-categorical)特性转换为新的预测变量少,可以删除描述性特性。功能转换方法包括主成分分析、因子分析和非负矩阵因子分解。
训练、验证和优化预测模型
比较不同的机器学习算法,包括浅神经网络,选择功能、调整hyperparameters和评估许多流行的分类和回归算法的性能。构建和自动优化预测模型和交互式应用程序,和改进模型流数据。减少标签数据的必要性应用semi-supervised学习。
模型的可解释性
提高黑盒用固有的可翻译的机器学习模型的可解释性等生殖添加剂模型(GAM),或通过建立可解释性方法包括部分依赖情节,个人条件期望(ICE),当地可判断的model-agnostic解释(石灰),和沙普利值。
自动机器学习(AutoML)
改善模型性能通过自动调优hyperparameters,生成和选择特性和模型,并与成本矩阵寻址数据集失衡。
线性和非线性回归
与多个预测模型复杂系统的行为或响应变量选择从许多线性和非线性回归算法。适合多级或分层,线性、非线性和广义线性mixed-effects与嵌套和/或交叉随机效应模型进行纵向或面板分析,反复的措施,和增长模型。
非参数回归
生成一个精确的适合不指定一个模型,描述了使用svm预测和响应之间的关系,随机森林,浅神经网络,高斯过程和高斯内核。
方差分析(方差分析)
分配样本方差不同的来源和确定变异出现在或在不同的人群。使用单向、双向、多路、多变量和非参数方差分析,以及协方差分析(ANOCOVA)和重复测量方差分析(RANOVA)。
概率分布
适合连续和离散分布,使用统计图拟合优度评价,计算概率密度函数和累积分布函数超过40个不同的分布。
假设检验
执行t分布测试(卡方,Jarque-Bera、Lilliefors Kolmogorov-Smirnov),和非参数测试,成对,或独立样本。测试自动校正和随机性,并比较分布(两个示例Kolmogorov-Smirnov)。
实验设计(DOE)
定义、分析和可视化定制的实验设计(DOE)。创建和测试实际的计划如何在串联生成操作数据输入信息对数据输出的影响。
可靠性和生存分析
可视化和分析失效数据和未经审查通过执行Cox比例风险回归和分布。计算经验风险,幸存者,和累积分布函数,以及核密度估计。
分析大数据与高数组
使用高数组和表与许多分类、回归和聚类算法训练模型不装入内存的数据集在不改变代码。
云计算和分布式计算
使用云实例来加快统计和机器学习计算。执行完整的机器学习工作流在MATLAB在线™。
代码生成
生成便携和可读的C或c++代码分类和回归算法的推理,描述性统计,概率分布用MATLAB编码器™。生成C / c++代码与预测精度降低使用定点设计师™,没有再生和更新部署模型的参数预测代码。
与仿真软件的集成金宝app
机器学习模型与仿真软件模型部署到集成嵌入式硬件或系统仿真,验证和验证。金宝app
与应用程序和企业系统集成
作为独立部署统计和机器学习模型,MapReduce,或火花™应用程序;作为web应用程序;或者是微软®Excel®使用MATLAB编译器插件™。构建C / c++共享库,微软。net程序集,Java®Python类,®使用MATLAB编译器SDK™包。