主要内容

高阵的可视化

可视化大型数据集需要以某种方式对数据进行汇总、分类或抽样,以减少在屏幕上绘制的点的数量。在某些情况下,函数如柱状图bin可以减少数据的大小,而其他功能如情节散射使用更复杂的方法,避免在屏幕上打印重复像素。对于像素重叠与分析相关的问题宾斯卡特函数还提供了一种可视化密度模式的有效方法。

可视化高大的阵列确实如此要求使用聚集. MATLAB®立即计算并显示高阵列的可视化效果。目前,您可以使用此表中的函数和方法可视化高数组。

函数 所需工具箱 笔记
情节

这些函数以迭代方式绘图,随着读取的数据量的增加,逐步添加到绘图中。在更新过程中,进度指示器显示已绘制的数据比例。在更新过程中,在绘图完成之前,支持缩放和平移。要停止更新过程,请按进度指示器中的暂停按钮或金宝app

散射
宾斯卡特
柱状图
组织图2

仅用于类别数据的可视化。

binScatterPlot(统计和机器学习工具箱) 统计和机器学习工具箱™

图中包含一个滑块,用于控制图像中的亮度和颜色细节。该滑块可调整图像的值γ图像校正参数。

ksdensity(统计和机器学习工具箱) 统计和机器学习工具箱

生成数据的概率密度估计值,对单变量数据评估100点,对双变量数据评估900点。

数据样本(统计和机器学习工具箱) 统计和机器学习工具箱

数据样本与简单索引相比,允许您以统计上合理的方式提取高数组的子样本。如果数据子集足够小,可以放入内存,则可以对不直接支持高数组的子集使用绘图和拟合功能。金宝app

高阵列绘图示例

这个例子展示了几种可视化高数组的不同方法。

创建一个数据存储airlinesmall.csv数据集,其中包含航空公司航班数据行。选择要使用的表变量子集,并删除包含缺少值的行。

ds=表格数据存储(“airlinesmall.csv”,“治疗减少”,“NA”);ds。SelectedVariableNames = {“年”,“月”,“ArrDelay”,“德布雷”,“起源”,“桌子”}; T=高(ds);T=rmm缺失(T)
TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTLAX'}1987 105963{'LAX'}{'SJC'}1987 103-2{'SAN'}{'SFO'}1987 1011-1{'SEA'}{'LAX'} : : : : : : : : : : : :

按月飞行的饼图

转换数值变量转换为反映月份名称的分类变量。然后绘制饼图,显示一年中每个月的数据中有多少航班。

T.月=分类(T.月,1:12{“1月”,2月的,“3”,4月的,“五月”,“六月”,“七月”,“八月”,“九月”,“10月”,“十一月”,12月的})
T = Mx6高表年月ArrDelay DepDelay起源服务台  ____ _____ ________ ________ _______ _______ 1987 10月8 12{“宽松”}{‘SJC} 1987 10月8 1{‘SJC}{“钻”}1987年10月21日20{‘圣’}{SMF的}1987年10月13日12{“钻”}{‘SJC} 1987 10月4 1 {SMF的}{“宽松”}1987 10月59 63{“宽松”}{‘SJC} 1987 10月3 2{‘圣’}{“旧金山”}1987年10月11日1{‘海’}{“宽松”}:: : : : : : : : : : :
馅饼(T.月)
using the Local MATLAB Session: - Pass 1 of 2: Completed in 1.6 sec - Pass 2 of 2: Completed in 1 sec

延迟直方图

在数据中绘制每个航班到达延迟的柱状图。由于数据具有长尾,请使用宾极限名称-值对。

直方图(T。ArrDelay,“BinLimits”,[-50 150])
使用本地MATLAB会话评估tall表达式:-第1次通过(共2次):在2.4秒内完成-第2次通过(共2次):在1.3秒内完成评估在4.3秒内完成

图中包含一个轴对象。轴对象包含一个直方图类型的对象。

延迟散点图

绘制到达和离开延迟的散点图。你可以预期这些变量之间有很强的相关性,因为起飞晚的航班也可能到达晚。

在高阵列上操作时情节,散射,宾斯卡特函数以迭代的方式绘制数据,随着读取更多数据而逐步添加到绘图中。在更新过程中,图的顶部有一个进度指示器,显示绘制了多少数据。在情节完成之前的更新过程中,支持缩放和平移。金宝app

散射(T.ArrDelay T.DepDelay)包含(“延误”) ylabel (“起飞延误”) xlim([-140 1000])

图中包含一个轴对象。轴对象包含一个散射类型的对象。

进度条还包括暂停/恢复按钮。一旦显示足够多的数据,使用该按钮可以尽早停止情节更新。

健康趋势线

使用拟合polyval函数用于在到达和离开延迟图上叠加线性趋势线。

持有p = polyfit (T.ArrDelay T.DepDelay 1);x = (T.ArrDelay, 1);yp = polyval (p (x);情节(x, yp,“r-”)举行

图中包含一个轴对象。“轴”对象包含两个类型为“散布”、“直线”的对象。

可视化密度

点的散点图在某一点上是有用的,但如果点的重叠很广泛,就很难从图中解读信息。在这种情况下,它有助于可视化图中的点密度,以发现趋势。

使用宾斯卡特函数可视化到达和出发延误图中的点密度。

binscatter(T.ArrDelay,T.DepDelay,“XLimits”,[-100 1000],“YLimits”,[-100 1000]) xlim([-100 1000]) xlabel(“延误”) ylabel (“起飞延误”)

图中包含一个轴对象。axis对象包含一个binscatter类型的对象。

调整这一属性,以便所有大于150的bin值都是相同的颜色。这可以防止一些值非常大的箱子占据整个情节。

甘氨胆酸ax =;斧子。[0 150];

图中包含一个轴对象。axis对象包含一个binscatter类型的对象。

另见

||

相关的话题