主要内容

Visualización de datos multivariados

在这里,我们可以看到很多不同的东西cómo可视化数据gráficas estadísticas。Muchos análisis estadísticos incluyen dos变量únicamente: una变量de predicción y una变量de respuesta。Estos datos pueden visualizarse fácilmente con gráficas de dispersión en 2D,直方图双变量,gráficas de caja等。También se pueden visualizar datos de tres变量con gráficas de dispersión en 3D, o gráficas de dispersión en 2D con una tercera变量codificada, por ejemplo, en otro颜色。罪恶的封锁,许多连词de datos包括un número de变量市长,lo que hace más difícil la visualización directa。Este ejemplo explore algunos de los modos en los que visualizar datos de altas dimensions en MATLAB®,utilitzando统计和机器学习工具箱™。

就在这里,就在这里,就在这里carbig,连续性变化变量中距近距离400 automóviles de las décadas de 1970 y 1980。Ilustraremos la visualización多变量可燃效率变量(en millas por galón, MPG), aceleración (0 a 60 millas por hora en segundos), cilindrada del motor (en pulgadas cúbicas),比索和势能。利用之道número群的观察之路。

负载carbigX = [MPG,加速度,位移,重量,马力];varNames = {“英里”“加速”“位移”“重量”“马力”};

矩阵de las gráficas de dispersión

La visualización de porciones a través de subspacacios de menor dimensión es de evitalalmente La limitación de dos o trres dimensions。Por ejemplo, podemos utilitzar la funcióngplotmatrixPara most strar UN arreglo de todas las gráficas de dispersión bivariadas entre nuestras cinco变量,junto con UN histograph univarado Para cada变量。

图gplotmatrix (X,[],气缸,“c”“b”“米”‘g’“r”],[][],假);文本([。08 .24 .43 .66 .83], repmat(- 0.1,1,5), varNames,“字形大小”8);文本(repmat(点1 5),(。86 . 82 . 82], varNames,“字形大小”8“旋转”, 90);

Los puntos de cada gráfica de dispersión están codificados por colorores según el número de cilindros:蓝色para 4 cilindros,绿色para 6 y rojo para 8。También干草五只藤蔓草和三只藤蔓草马达旋转。Este arreglo de gráficas便利的挽歌,庇护的关系,中心的变量。罪恶禁运,在没有结果的维度上的重要庇护者fáciles在没有结果的维度上的侦察者gráfica。

Gráficas de coordenadas parallelas

La matriz de gráficas de dispersión muestra relaciones双变量。存在的其他变量的选择的muestran todas las变量juntas, que允许调查关系的市长dimensión entre las变量。La gráfica multivariable más directa es La gráfica de coordenadas parallelas。地址gráfica,坐标中心sitúan水平坐标中心坐标中心gráfica坐标estándar。Cada observación se representa en la gráfica como una serie de segmentos lineales conectados。Por ejemplo, podemos crear una gráfica con los coches con 4,6 u 8 cilindros y observaciones de color Por grupo。

Cyl468 = ismember(气缸,[4 68]);parallelcoords (X (Cyl468:)“集团”气缸(Cyl468),...“标准化”“上”“标签”varNames)

La dirección水平的de esta gráfica代表了los ejes de coordenadas, y La dirección垂直的代表了los datos。Cada observación se realiza con medias de cinco变量,y Cada medida se代表como la altura a la que Cada línea cordiente cruza Cada eje de coordenadas。我们有很多不同的变量,gráfica我们有很多不同的变量,realizó我们有很多不同的变量,我们有很多不同的变量。Con el código de color, la gráfica muestra, por ejemplo, que los coches de 8cilindros normalmente tienores bajos de millas por galón y aceleración, y valores altos de cilindrada, peso y potencia。

包括asignación色彩集团,gráfica坐标平行联盟número高观测结果difícil斜视。También podemos crear una gráfica de coordenadas parallelas en la que solo se muestren la media y los cuartiles (25% y 75%) de cada grupo。Esto hace que sea más fácil distinguir las típicas diferencias y simmilitudes entre grupos。我爱你,我爱你atípicos我爱你más我爱你,我爱你gráfica。

parallelcoords (X (Cyl468:)“集团”气缸(Cyl468),...“标准化”“上”“标签”varNames,分位数的或25)

Gráficas德安德鲁

Otro tipo de visualización multivariable es la gráfica de Andrew。Esta gráfica代表cada observación como una función suave sobre el intervalo[0,1]。

andrewsplot (X (Cyl468:)“集团”气缸(Cyl468),“标准化”“上”

Cada función es ena serie de Fourier, con coicientes que equivalent a los valores de observación correspondent。En este ejemplo, la serie tiene cinco términos: una constante, dos términos de seno con periodos 1 y 1/2 y dos términos de coseno similares。Los efectos en las formas de las funciones debidos a Los treres términos principales son Los más证据en una gráfica de Andrews, por lo que Los赞助人en las treres primeras变量tienden a ser Los más fáciles de reconocer。

Hay una clara diferencia entre los grupos ent = 0, lo que indica que la primera variable, MPG, es una de las características distinct entre los coches de 4,6 y 8 cilindros。结果más在不同的地方,在不同的地方,在不同的地方,在不同的地方,在不同的地方= 1/3。引见英勇之士fórmula功能之士gráficas安德鲁斯之士,定义之系数之联合之士combinación线性变量之区别中心之群。

T1 = 1/3;(1 /√(2)罪(2 *π* t1)因为(2 *π* t1)罪(4 *π* t1)因为(4 *π* t1))
Ans = 0.7071 0.8660 -0.5000 -0.8660 -0.5000

一个关于系数的聚会,一个关于关系的形式的我们在不同的地方有不同的方法4条香油和8条香油和其他的香油和其他的方法más有价值的东西aceleración,有价值的东西más香油和其他的东西,强大的力量,清醒的权利,比索,第二个香油和其他的方法。Es la misma conclusión que extrajimos de la gráfica de coordenada parallelas。

Gráficas de glifo

多变量数据的可视化方法和实用方法"格里弗斯"对维度的再现。脂肪酸的glyphplotes compatible con dos tipos de glifos: estrellas y caras de Chernoff。Por ejemplo, aquí hay una gráfica de estrella delos primeros 9 modelos de coches。Cada radio de la estrella代表一个变量,y la longitude del radio es比例al valor de esa变量para observación。

h = glyphplot(X(1:9,:),“字形”“星”“varLabels”varNames,“obslabels”、模型(1:9,:));集(h (:, 3),“字形大小”8);

活生生的MATLAB图解,este gráfico permitiría la exploración数据价值的交互,数据的使用。我爱你,我爱你,我爱你,我爱你,我爱你,我爱你,我爱你,我爱你,我爱你。

Gráficas de glifo y escalas multidimensionales

在那的星宿代表cuadrícula,罪恶的决定,在那混乱的星宿,在那不同的星宿。Por lo tanto, puede que no haya un patrón suave que detectar。一个菜单结果útil组合el escalado多维(MDS) con una gráfica de glifos。1977年,参考《我的爱》和《我的爱》funciónzscore一个统一的标准,一个统一的变化,一个统一的媒介,一个统一的变化。Después天文计算euclídeas中央天文标准计算中心diferenciación。Esta elección puede resultar demasiado简单的en una aplicación真实的,pero sirve para ilustrar el ejemplo。

models77 = find((Model_Year==77));dissimilarity = pdist(zscore(X(models77,:)));

Finalmente, utilizaremosmdscalePara crear UN conjunto ubicaciones en DOS尺寸cuyas distance entre puntos se proximen las差异点entre los datos original de alta dimensión, y trazar los glifos utilizdo esubicaciones。我们的距离gráfica 2D生育的距离,我们的距离gráfica足够的距离。

Y = mdscale(dissimilarity,2);glyphplot (X (models77:)“字形”“星”“中心”, Y,...“varLabels”varNames,“obslabels”模型(models77:),“半径”5);标题(“1977车型年”);

En esta gráfica, hemos utilizado MDS como un método de reducción de dimensión para crear una gráfica En 2D。Normalmente eso significaría una pérdida de información, pero al trazar los glifos, hemos incorporated toda la información de alta dimensión de los datos。El propósito de utilizar El MDS es imponer cierta regularidad a la variación de los datos, para que los patones entre los glifos sean más fáciles de ver。

Al igual que con la gráfica前,una exploración interactiva resultaría可能的en una ventana de figuras。

Otro tipo de glifo es la cara de Chernoff。Este glifo代表los valores de los datos de cada observación en rasgos faciales, como el tamaño de la cara, la forma del rostro, la posición de los ojos等。

glyphplot (X (models77:)“字形”“脸”“中心”, Y,...“varLabels”varNames,“obslabels”模型(models77:));标题(“1977车型年”);

En este caso, los dos rasgos más父母,el tamaño de la cara y el tamaño相对de la frente y la mandíbula,代表la MPG y la aceleración, mientras que la forma de la frente y la mandíbula对应a la cilindrada y al peso。这是一段距离。美洲驼la atención que haya pocas caras con frentes anchas y mandíbulas estrechas, o反之亦然,lo que indica una correlación线性正能量中心变量cilindrada y比索。Eso es también que vimos en la gráfica de dispersión。

La correspondencia de las características con las变量决定qué relaciones son más fáciles de ver, yglyphplotPermite cambiar la selección fácilmente。

关闭