主要内容

zscore

标准化z分数

描述

例子

Z= zscore(X返回z分数对于每个元素X这样的列X集中到均值0,缩放到标准差1。Z的尺寸与相同X

  • 如果X是向量吗Z是向量z分数。

  • 如果X是一个矩阵,然后Z的大小与相同的矩阵X,每一列Z具有平均为0,标准偏差为1。

  • 多维数组z分数在Z沿着第一个nonsingleton维度X

例子

Z= zscore(X旗帜尺度X用表示的标准差旗帜

  • 如果旗帜是0(默认值),则zscore尺度X使用样本标准偏差,n- 1中的标准偏差公式的分母。zscore (X, 0)是一样的zscore (X)

  • 如果旗帜是1,那么zscore尺度X使用总体标准偏差,n在标准差公式的分母上。

例子

Z= zscore(X旗帜, '所有')标准化X用中所有值的均值和标准差X

例子

Z= zscore(X旗帜昏暗的标准化X沿操作尺寸昏暗的.例如,对于一个矩阵X,如果昏暗的= 1,然后zscore使用平均值和标准偏差X,如果昏暗的= 2,然后zscore用的是均值和标准差X

例子

Z= zscore(X旗帜vecdim标准化X除以向量指定的维数vecdim.例如,如果X是一个矩阵,然后zscore(X,0,[1 2])相当于zscore (X, 0, '所有')因为矩阵中的每个元素被包含在阵列切片通过尺寸1和2中所定义。

例子

Zμσ] = zscore(___也返回用于定心和缩放所述平均值和标准偏差,μσ,分别。您可以使用前面语法中的任何输入参数。

例子

全部折叠

计算和绘制 z -scores两个数据载体,然后比较其结果。

加载示例数据。

负载lawdata

两个变量加载到工作区中:平均绩点LSAT.

在相同的坐标轴上绘制两个变量。

情节((gpa, lsat))传说(“成绩”'LSAT'“位置”“东”

图中包含一个坐标轴。轴线包含2个线型对象。这些对象代表gpa, lsat。

很难比较这两种措施,因为它们的规模非常不同。

绘出 z 的-scores平均绩点LSAT.在相同的坐标轴上。

Zgpa = zscore(GPA);Zlsat = zscore(LSAT);积([Zgpa,Zlsat])图例(“gpa z分数”“LSAT Z评分”“位置”“东北”

图中包含一个坐标轴。轴线包含2个线型对象。这些对象代表gpa z-scores, lsat z-scores。

现在,你可以看到个体的相对表现平均绩点LSAT.结果。例如,第三个人平均绩点LSAT.结果均低于样本均值一个标准差。11个人的平均绩点是否在样本均值附近,但有一个LSAT.得分比样本平均水平高出近1.25个标准差。

检查的平均值和标准偏差 z 创建分数。

意思是([Zgpa Zlsat])
ans =1×210-14×-0.1088 - 0.0357
性病([Zgpa Zlsat])
ans =1×21 1

根据定义, z 的-scores平均绩点LSAT.均值为0,标准差为1。

加载示例数据。

负载lawdata

两个变量加载到工作区中:平均绩点LSAT.

计算 z 的-scores平均绩点使用标准偏差的人口式。

Z1 = zscore (gpa, 1);%的人口公式Z0 = zscore(GPA,0);%样本公式disp ((Z1 Z0))
1.2554 1.2128 0.8728 0.8432 -1.2100 -1.1690 -0.2749 -0.2656 1.4679 1.4181 -0.1049 -0.1013 -0.4024 -0.3888 1.4254 1.3771 1.1279 1.0896 0.1502 0.1451 0.1077 0.1040 -1.5076 -1.4565 -1.4226 -1.3743 -0.9125 -0.8815 -0.5724 -0.5530

对于从群体,人口标准偏差公式与样品 n 在分母中对应的是总体标准差的最大似然估计,可能是有偏的。另一方面,样本标准差公式是一个样本总体标准差的无偏估计量。

计算 z -使用沿着数据矩阵的列或行计算的平均值和标准偏差得到的分数。

加载示例数据。

负载流感

数据集的数组流感是在工作场所。流感对11个变量进行了52次观察。第一个变量包含日期(以周为单位)。其他变量包括美国不同地区的流感估计值

将数据集数组转换为数据矩阵。

flu2 =双(流感(:,2:结束));

新的数据矩阵,flu2,是一个52乘10的双数据矩阵。行对应于周,列对应于数据集数组中的美国地区流感

规范流感估计每个区域(flu2).

Z1 = zscore(flu2,[],1);

你可以看到 z -scores在变量编辑器中通过双击矩阵Z1在工作区中创建的。

将每周的流感估计标准化flu2).

Z2 = zscore(flu2,[],2);

通过指定到标准化沿不同维度中的数据找到一个多维阵列的z分数。使用时比较结果“所有”昏暗的,vecdim输入参数。

创建一个3 × 4 × 2的数组。

X =重塑(1:24,[3 4 2])
X = X(:,:,1)= 1 4 7 10 2 5 8 11 3 6 9 12 X(:,:,2)= 13 16 19 22 14 17 20 23 15 18 21 24

标准化X用中所有值的均值和标准差X

卓尔= zscore(X,0,“所有”
Zall(:,:,2) = Zall(:,: 1) = -1.6263 -1.2021 -0.7778 -0.3536 -1.4849 -1.0607 -0.6364 -0.2121 -1.3435 -0.9192 -0.4950 -0.0707

得到的多维z分数数组的均值为0,标准差为1。例如,计算的平均值和标准差卓尔

mZall =平均值(卓尔(:,:,:),“所有”
mZall = -9.2519 e-18
sZall =性病(Zall (:,:,:), 0,“所有”
sZall = 1.0000

现在规范X沿着第二个维度。

Zdim = zscore (X 0 2)
Zdim(:,: 1) = -1.1619 -0.3873 0.3873 1.1619 -1.1619 -0.3873 0.3873 1.1619 -1.1619 -0.3873 0.3873 1.1619

的每页每行中的元素Zdim均值为0,标准差为1。例如,计算的第二页第一行的平均值和标准偏差Zdim

mZdim =意味着(Zdim (1: 2),“所有”
mZdim = 0
sZdim =性病(Zdim (1: 2), 0,“所有”
sZdim = 1

最后,规范X基于第二和第三维度。

Zvecdim = zscore(X,0,[2 3])
Zvecdim = Zvecdim(:,: 1) = -1.4289 -1.0206 -0.6124 -0.2041 -1.4289 -1.0206 - 0.6206 -0.2041 -1.4289 -1.0206 -0.2041 -1.4289 -1.0206 - 0.6206 -0.2041

在每个元件Zvecdim(我::)切片的均值为0,标准差为1。例如,计算中元素的平均值和标准偏差Zvecdim (1::)

mZvecdim =平均值(Zvecdim(1,:,:),“所有”
mZvecdim = 2.7756 e-17
sZvecdim =性病(Zvecdim (1::), 0,“所有”
sZvecdim = 1

返回用于计算的平均值和标准偏差 z 分数。

加载示例数据。

负载lawdata

两个变量加载到工作区中:平均绩点LSAT.

返回 z 的-分数、平均值和标准偏差平均绩点

[Z, gpamean, gpastdev] = zscore (gpa)
Z =15×11.2128 0.8432 -1.1690 -0.2656 1.4181 -0.1013 -0.3888 1.3771 1.0896 0.1451⋮
gpamean = 3.0947
gpastdev = 0.2435

输入参数

全部折叠

输入数据,指定为向量、矩阵或多维数组。

数据类型:双倍的|

用于计算的标准偏差指标z-scores,指定为0或1。

  • 如果旗帜是0(默认值),则zscore尺度X使用样本标准偏差zscore (X, 0)是一样的zscore (X)

  • 如果旗帜是1,那么zscore尺度X使用总体标准偏差

要计算的尺寸z的-scoresX,指定为正整数标量。如果不指定值,则默认值是大小不等于1的第一个数组维度。

例如,对于一个矩阵X,如果昏暗的= 1,然后zscore使用平均值和标准偏差X,如果昏暗的= 2,然后zscore用的是均值和标准差X

沿要计算其尺寸的向量z的-scoresX,指定为正整数向量。的每个元素vecdim表示输入数组的一个维度X.输出Z有相同的尺寸X,但平均数μ和标准偏差σ每个操作维度的长度都是1。其他尺寸长度是相同的Xμ,σ

例如,如果X是2乘3乘3的数组吗zscore(X,0,[1 2])使用平均值和标准偏差X使…的价值标准化X

数据类型:|双倍的

输出参数

全部折叠

z-分数,以向量、矩阵或多维数组的形式返回。Z有相同的尺寸X

的值Z是否指定取决于“所有”昏暗的,或vecdim.如果没有指定任何这些输入参数,则下列条件:

  • 如果X是向量吗Z是向量z-得分的均值为0,方差为1。

  • 如果X是一个数组吗zscore的第一个非单一维度标准化X

举个例子来说明Z当你使用“所有”昏暗的,vecdim,请参阅多维数组的Z值

的意思是X用于计算z-scores,返回为标量,矢量,矩阵或多维数组。μ在规定的操作尺寸中长度为1。其他尺寸长度是相同的Xμ

例如,如果X是一个2乘3乘3的数组吗vecdim[1 2],然后μ是一个1 × 1 × 3的均值数组。每个值在μ对应于平均页面X

标准偏差的X用于计算z-scores,返回为标量,矢量,矩阵或多维数组。σ在规定的操作尺寸中长度为1。其他尺寸长度是相同的Xσ

例如,如果X是一个2乘3乘3的数组吗vecdim[1 2],然后σ是一个1×1×3阵列的标准偏差的。每个值在σ对应于每一页的标准差X

更多关于

全部折叠

z分数

对于一个随机变量X用平均μ和标准差σ表示z值的-scorex

z x μ. σ.

对于具有均值的样本数据 X ¯ 和标准偏差年代,z-score数据点的x

z x X ¯ 年代

z-scores用标准偏差来衡量一个数据点到平均值的距离。这也被称为标准化数据的。标准化数据集具有平均为0,标准偏差为1,并保留原始数据集的形状属性(相同偏度和峰度)。

您可以使用z-scores穿上同规模前进一步的分析数据。这使您可以将两个或多个数据集不同的单位进行比较。

多维数组

一个多维数组是一个二维以上的数组。例如,如果X是一个1 × 3 × 4的数组,那么X是一个三维阵列。

第一个Nonsingleton维度

一个第一个nonsingleton维度是大小不等于1的数组的第一个维度。例如,如果X是一个1×2×3×4阵列,则该第二尺寸的第一nonsingleton维X

样本标准差

样本标准偏差年代是由

年代 1 n x X ¯ 2 n 1

年代是总体方差的平方根估计值吗X绘制,只要X由独立的、同分布的样本组成。 X ¯ 为样本平均值。

注意,此方差式中的分母是n- 1。

总体标准偏差

如果数据是值的全部填充,则可以使用总体标准偏差

σ. 1 n x μ. 2 n

如果X是从人口的随机样本,然后平均μ.是由样本均值估计的,而σ.是总体标准偏差的偏置最大似然估计。

注意,此方差式中的分母是n

算法

zscore返回S适用于任何含有年代。

zscore返回0■对于恒定(所有值都相同)的任何样品。例如,如果X是相同数值的向量吗Z是向量0年代。

扩展能力

之前介绍过的R2006a