统计和机器学习工具

分析和模型数据使用统计和机器学习

下载一个免费试用

查看价格

统计和机器学习工具箱™提供功能和应用程序来描述、分析和模型数据。您可以使用描述性统计、可视化和聚类的探索性数据分析;适合数据概率分布;生成随机数的蒙特卡罗模拟,并执行假设测试。回归和分类算法让你从数据得出结论并建立预测模型交互,使用分类和回归学习者应用程序,或者通过编程,使用AutoML。

多维数据分析和特征提取,工具箱提供了主成分分析(PCA),正规化,降维,特征选择方法,让你识别变量与最好的预测能力。

工具箱提供了监督、semi-supervised和非监督机器学习算法,包括支持向量机(svm),提高了决策树金宝app,k - means,和其他聚类方法。您可以应用可解释性等技术部分依赖情节和石灰,并自动生成C / c++代码为嵌入式部署。许多工具箱算法可用于数据集太大被存储在内存中。

开始:

统计和机器学习的工具箱是什么?

探索性数据分析

探索数据通过统计策划与交互式图形和描述性统计。识别模式和特征聚类。

可视化

使用概率图,直观地探索数据盒阴谋,直方图,quantile-quantile情节,和先进的地块进行多变量分析,如系统树图,biplots,安德鲁斯的情节。

多元数据可视化

概述可用的统计图

箱线图为分组数据

使用随机邻居嵌入高维数据可视化

使用多维散点图探索变量之间的关系。

描述性统计

理解和描述潜在的大型数据集的快速使用一些高度相关的数字。

概述的描述性统计

摘要统计信息按类别分组

处理数据缺失值

使用Kernel-Smoothing密度估计函数

使用分组探索数据均值和方差。

聚类分析

发现模式通过使用k - means分组数据、k-medoids DBSCAN,层次和谱聚类和高斯混合隐马尔可夫模型。

聚类分析的概述

交互式地探索k - means聚类

Density-Based空间聚类的应用程序与噪声(DBSCAN)

使用拉普拉斯算子的分数等级特性无监督学习

DBSCAN应用到两个同心组。

特征提取与降维

将原始数据转换成特征最适合机器学习。反复探索和创建新功能,并选择的优化性能。

特征提取

从数据中提取特征使用无监督学习技术,如稀疏的过滤和重建ICA。您还可以使用专门的技术从图像中提取特征,信号,文本和数字数据。从表格数据自动生成新特性分类和回归。

特征提取工作流程

信号与图像的特征提取

文本与文本分析工具箱™数据准备

图像分类使用深度学习特性

从信号中提取特征所提供的移动设备。

特征选择

自动识别的特征子集提供最好的预测能力的建模数据。特征选择方法包括逐步回归、序列特征选择,正规化,合奏的方法。

使用社区成分分析检测功能(NCA)进行分类

使用最小冗余最大相关性等级特性分类(MRMR)

选择特性对高维数据进行分类

通过应用正则化防止过度拟合

NCA帮助选择保留大部分的功能模型的准确性。

功能转换和降维

减少维度通过将现有的(non-categorical)特性转换为新的预测变量少,可以删除描述性特性。功能转换方法包括主成分分析、因子分析和非负矩阵因子分解。

降维的概述在MATLAB和特征转换技术

使用PCA分析美国城市的生活质量

了解功能转换和选择技术

主成分分析可以将高维向量投影到一个低维正交坐标系与大多数保存的信息。

机器学习

使用交互式应用程序构建预测分类和回归模型或自动机器学习(AutoML)。自动选择功能,确定最佳模型,优化hyperparameters。通过应用解释模型行为可解释性算法。

训练、验证和优化预测模型

比较不同的机器学习算法,包括浅神经网络,选择功能、调整hyperparameters和评估许多流行的分类和回归算法的性能。构建和自动优化预测模型和交互式应用程序,和改进模型流数据。减少标签数据的必要性应用semi-supervised学习。

火车回归模型中回归学习者应用

回归学习者应用(3:42)

MATLAB进行数据分析(55分钟)

最佳实践构建和评估预测模型

评估分类模型使用ROC曲线(43)

不同的无监督异常检测技术

使用分类学习者应用分类数据

模型的可解释性

提高黑盒用固有的可翻译的机器学习模型的可解释性等生殖添加剂模型(GAM),或通过建立可解释性方法包括部分依赖情节,个人条件期望(ICE),当地可判断的model-agnostic解释(石灰),和沙普利值。

概述MATLAB的可解释性

应用部分依赖情节(PDP)和个人条件期望(ICE)情节回归

在MATLAB模型解释能力(5:49)

本地可Model-Agnostic解释(石灰)

在MATLAB应用夏普利值

可视化决定表面不同的分类器

石灰构建复杂模型的简单近似在当地区域。

自动机器学习(AutoML)

改善模型性能通过自动调优hyperparameters,生成和选择特性和模型,并与成本矩阵寻址数据集失衡。

AutoML是什么?

在一个步骤自动模型选择和Hyperparameter优化

Hyperparameter优化解释(43)

贝叶斯优化工作流程

快速自动模型选择与亚莎的优化

使用贝叶斯优化优化hyperparameters有效。

回归和方差分析

模型连续响应变量作为函数的一个或多个预测,使用线性和非线性回归,mixed-effects模型、广义线性模型和非参数回归。使用方差分析差异分配给不同的来源。

线性和非线性回归

与多个预测模型复杂系统的行为或响应变量选择从许多线性和非线性回归算法。适合多级或分层,线性、非线性和广义线性mixed-effects与嵌套和/或交叉随机效应模型进行纵向或面板分析,反复的措施,和增长模型。

应用回归分析纽约市住房数据

描述非线性关系

多级Mixed-Effects使用MATLAB建模(34:44)

了解广义线性模型

合适的回归模型与回归学习者应用程序交互。

非参数回归

生成一个精确的适合不指定一个模型,描述了使用svm预测和响应之间的关系,随机森林,浅神经网络,高斯过程和高斯内核。

适应和优化支持向量机(SVM)回归模型金宝app

随机森林预测保险风险与回归

了解高斯过程回归

使用分位数回归检测异常值

使用分位数回归识别异常值。

方差分析(方差分析)

分配样本方差不同的来源和确定变异出现在或在不同的人群。使用单向、双向、多路、多变量和非参数方差分析,以及协方差分析(ANOCOVA)和重复测量方差分析(RANOVA)。

介绍了单向方差分析

了解多重比较

多路平衡和不平衡数据的方差分析(多方方差分析)

使用多路方差分析测试组。

概率分布和假设测试

适合数据分布。分析样本的差异是否显著的或与随机数据变化一致。生成随机数从不同的分布。

概率分布

适合连续和离散分布,使用统计图拟合优度评价,计算概率密度函数和累积分布函数超过40个不同的分布。

使用健康应用分布模型数据

可用概率分布

计算,健康,或生成样本多元分布

合适的定制单变量分布

适合分布交互地使用钳工分布应用程序。

随机数生成

生成伪随机和拟随机流从安装或构造概率分布。

生成随机数交互

生成拟随机数字

了解蒙特卡罗模拟

模拟使用接合部因变量

交互地生成随机数。

假设检验

执行t分布测试(卡方,Jarque-Bera、Lilliefors Kolmogorov-Smirnov),和非参数测试,成对,或独立样本。测试自动校正和随机性,并比较分布(两个示例Kolmogorov-Smirnov)。

介绍假设检验

——或双面四:测试比例或相关性

执行两个示例学习任务

卡方拟合优度检验

拒绝地区片面的学习任务。

工业统计数据

统计分析效果和数据趋势。应用工业统计技术如一个定制的实验设计和统计过程控制。

实验设计(DOE)

定义、分析和可视化定制的实验设计(DOE)。创建和测试实际的计划如何在串联生成操作数据输入信息对数据输出的影响。

规划概论实验系统的数据收集

响应面设计,包括Box-Behnken

Box-Behnken设计应用于生成高阶响应面。

统计过程控制(SPC)

监测和改进产品或流程的评估过程的可变性。下载188bet金宝搏创建控制图,估计过程能力,并执行量具重复性和再现性研究。

介绍控制图

提高发动机冷却风扇使用六西格玛设计技术

使用控制图监控生产过程。

可靠性和生存分析

可视化和分析失效数据和未经审查通过执行Cox比例风险回归和分布。计算经验风险,幸存者,和累积分布函数,以及核密度估计。

审查经验分布和最大似然估计

Cox比例风险模型协变量随时间变化

估计累积风险,幸存者,并使用kaplan meier累积分布

估计Re-Admissions使用Cox比例风险模型

分析生命周期数据审查

故障数据为例,“审查”的价值观。

大数据、并行化和云计算

数据统计和机器学习技术应用于内存不足。加快统计计算和机器学习模型训练与并行集群和云实例。

分析大数据与高数组

使用高数组和表与许多分类、回归和聚类算法训练模型不装入内存的数据集在不改变代码。

航班延误模型在大数据集使用高数组

函数支持高数组的概述金宝app

大数据,数据分析,和机器/深度学习在卡特彼勒基础设施(18:47)

MATLAB高大的数组

并行计算

加快统计计算和模型训练和并行化。

介绍并行机器学习与并行计算工具箱™

学习如何在MATLAB加速计算

MATLAB与R基准

MATLAB与Python^®:选择MATLAB的首要因素

加快计算与并行计算工具箱或MATLAB并行服务器™。

云计算和分布式计算

使用云实例来加快统计和机器学习计算。执行完整的机器学习工作流在MATLAB在线™。

在AWS访问云实例和Azure^®MATLAB参考体系结构

在您的Web浏览器中访问MATLAB在线

英伟达访问云实例^®GPU云

在亚马逊或Azure云实例执行计算。

部署、代码生成和仿真软件的集成金宝app

部署统计和机器学习嵌入式系统,加速计算密集型计算使用C代码,与企业系统集成和仿真软件模型。金宝app

代码生成

生成便携和可读的C或c++代码分类和回归算法的推理,描述性统计,概率分布用MATLAB编码器™。生成C / c++代码与预测精度降低使用定点设计师™,没有再生和更新部署模型的参数预测代码。

代码生成工作流的概述

生成C代码与编码器应用机器学习模型

更新模型参数代码生成

生成定点C / c++支持向量机预测

系统™对象分类和代码生成

两条路径部署:生成C代码或MATLAB编译代码。

与仿真软件的集成金宝app

机器学习模型与仿真软件模型部署到集成嵌入式硬件或系统仿真,验证和验证。金宝app

集成支持向量机预测模型金宝app^®使用本机块

浅神经网络集成模型金宝app

在仿真软件应用机器学习金宝app^®使用MATLAB功能块

Simulink library for machine learning with native blocks for SVM prediction.

" data-toggle="lightbox" class="fluid_link">

金宝app机器学习模型库与本地块SVM预测。

与应用程序和企业系统集成

作为独立部署统计和机器学习模型,MapReduce,或火花™应用程序;作为web应用程序;或者是微软^®Excel^®使用MATLAB编译器插件™。构建C / c++共享库,微软。net程序集,Java^®Python类,^®使用MATLAB编译器SDK™包。

数据分析与MATLAB(53:40)

人类活动识别部署在智能手机

一键部署到MATLAB生产服务器

使用MATLAB编译器集成一个空气质量分类模型。

代码生成和更新工作流模型

产品资源:

文档功能技术文章用户故事产品需求发布说明视频和网络研讨会例子

机器学习斜坡弯道

交互式介绍实用机器学习分类问题的方法。

细节和发射

统计和机器学习工具

统计和机器学习工具

分析和模型数据使用统计和机器学习

开始:

探索性数据分析

可视化

描述性统计

聚类分析

特征提取与降维

特征提取

特征选择

功能转换和降维

机器学习

训练、验证和优化预测模型

模型的可解释性

自动机器学习(AutoML)

回归和方差分析

线性和非线性回归

非参数回归

方差分析(方差分析)

概率分布和假设测试

概率分布

随机数生成

假设检验

工业统计数据

实验设计(DOE)

统计过程控制(SPC)

可靠性和生存分析

大数据、并行化和云计算

分析大数据与高数组

并行计算

云计算和分布式计算

部署、代码生成和仿真软件的集成金宝app

代码生成

与仿真软件的集成金宝app

与应用程序和企业系统集成

产品资源:

机器学习斜坡弯道

得到一个免费试用

准备买什么?

你是学生吗?