描述性统计

数值摘要和相关措施

计算从样本数据,包括集中趋势的措施,分散,形状,相关性,和协方差描述性统计。制表和交叉制表数据和分组数据计算汇总统计。如果您的数据中包含缺失(为NaN)值,MATLAB®运算函数的返回为NaN。然而,在统计和机器学习工具箱中可用专门的职能™忽略这些缺失值,并返回使用剩余值计算出的数值。欲了解更多信息,请参阅缺失值数据

功能

展开全部

几何平均值 几何平均数
harmmean 调和平均数
TRIMMEAN 意思是说,排除异常值
nanmean 意思是说,忽略为NaN
nanmedian 中位数,忽略为NaN
峰度 峰度
时刻 中央时刻
偏态 偏态
nanstd 标准偏差,忽略为NaN
nanvar 差异,忽视为NaN
范围 值范围
nanmax 最大,忽视为NaN
nanmin 最小,忽略为NaN
IQR 四分位距
平均值或中值绝对偏差
prctile 一个数据集的百分
位数 一个数据集的分位数
zscore 标准化ž-scores
科尔 线性或等级相关
robustcov 强大的多变量协方差和均值估计
cholcov 乔莱斯基般的协方差分解
corrcov 转换协方差矩阵对相关矩阵
partialcorr 直链或秩偏相关系数
partialcorri 调整内部变量偏相关系数
nancov 协方差忽视为NaN
nearcorr 通过最小化弗罗贝纽斯距离计算最近的相关矩阵
grpstats 汇总统计按组安排
制表 频率表
交叉表 交叉制表
tiedrank 等级调整的关系
nansum 总之,忽视为NaN

主题

数据的探索性分析

探索使用描述性统计数据的分布。

缺失值数据

计算描述性统计,而忽略遗漏值。

集中趋势的措施

定位数据的沿着一个适当的标度的分布。

分散的措施

找出摊开的数据值是如何在数轴上。

分位数和百分

学习统计和机器学习工具箱如何计算位数和百分位数。

分组变量

分组变量是用于组或分类观测效用变量。