主要内容

高阵列可视化

可视化大型数据集需要以某种方式对数据进行汇总、分类或采样,以减少在屏幕上绘制的点的数量。在某些情况下,函数如柱状图而且Bin可以减小数据的大小,而其他功能则如情节而且散射使用更复杂的方法避免在屏幕上绘制重复像素。对于像素重叠与分析相关的问题,请使用binscatter函数还提供了一种可视化密度模式的有效方法。

可视化高数组可以要求使用收集.MATLAB®立即计算并显示高数组的可视化结果。目前,您可以使用此表中的函数和方法来可视化高数组。

函数 需要工具箱 笔记
情节 - - - - - -

这些函数以迭代的方式绘制图形,随着读取的数据越来越多,逐渐添加到图形中。在更新期间,进度指示器显示已绘制的数据的比例。在更新过程中,在绘图完成之前,支持缩放和平移。金宝app如果要停止更新进程,请按进度指示灯上的暂停按钮。

散射 - - - - - -
binscatter - - - - - -
柱状图 - - - - - -
histogram2 - - - - - -
- - - - - -

仅用于可视化分类数据。

binScatterPlot(统计和机器学习工具箱) 统计和机器学习工具箱™

图中包含一个滑块,用于控制图像中的亮度和颜色细节。的值γ图像校正参数。

ksdensity(统计和机器学习工具箱) 统计和机器学习工具箱

生成数据的概率密度估计,对单变量数据以100点进行评估,对双变量数据以900点进行评估。

datasample(统计和机器学习工具箱) 统计和机器学习工具箱

datasample与简单索引相比,使您能够以统计上合理的方式提取高数组的子样本。如果数据子集小到可以装入内存,则可以在不直接支持高数组的子集上使用绘图和拟合函数。金宝app

高阵列绘图实例

这个例子展示了几种不同的可视化高数组的方法。

对象的数据存储airlinesmall.csv数据集,其中包含航空公司航班数据行。选择要使用的表变量子集,并删除包含缺失值的行。

ds = tabularTextDatastore(“airlinesmall.csv”“TreatAsMissing”“NA”);ds。SelectedVariableNames = {“年”“月”“ArrDelay”“DepDelay”“起源”“桌子”};T =高(ds);T = rmmissing(T)
T = Mx6高表年月ArrDelay DepDelay起源服务台  ____ _____ ________ ________ _______ _______ 1987年10 8 12{“宽松”}{‘SJC} 1987年10 8 1{‘SJC}{“钻”}1987年10 21 20{‘圣’}{SMF的}1987年10 13 12{“钻”}{‘SJC} 1987年10 4 1 {SMF的}{“宽松”}59 1987 63{“宽松”}{‘SJC} 1987年10 3 2{‘圣’}{“旧金山”}1987年10 11 1{‘海’}{松懈 '} : : : : : : : : : : : :

每月航班饼图

转换数值变量转换为反映月份名称的分类变量。然后绘制一个饼状图,显示一年中每个月的数据中有多少航班。

月=分类的;月,1:12,{“1月”2月的“3”4月的“可能”“君”“7”“8月”“9”“10月”11月的12月的})
T = Mx6高表年月ArrDelay DepDelay起源服务台  ____ _____ ________ ________ _______ _______ 1987 10月8 12{“宽松”}{‘SJC} 1987 10月8 1{‘SJC}{“钻”}1987年10月21日20{‘圣’}{SMF的}1987年10月13日12{“钻”}{‘SJC} 1987 10月4 1 {SMF的}{“宽松”}1987 10月59 63{“宽松”}{‘SJC} 1987 10月3 2{‘圣’}{“旧金山”}1987年10月11日1{‘海’}{松懈 '} : : : : : : : : : : : :
派(T.Month)
使用本地MATLAB会话评估tall表达式:-通过2中的1:在1.6秒内完成-通过2中的2:在1秒内完成评估在3.4秒内完成

延误直方图

在数据中绘制每个航班到达延误的直方图。方法限制绘图区域,因为数据具有长尾BinLimits名称-值对。

直方图(T。ArrDelay,“BinLimits”150年[-50])
使用本地MATLAB会话评估tall表达式:-通过2中的第1步:在2.4秒内完成-通过2中的第2步:在1.3秒内完成评估在4.3秒内完成

图中包含一个轴对象。坐标轴对象包含一个直方图类型的对象。

延误散点图

绘制到达和起飞延误的散点图。你可以预期这些变量之间有很强的相关性,因为晚点起飞的航班也可能晚点到达。

在高数组上操作时,情节散射,binscatter函数以迭代的方式绘制数据图,随着读取的数据越来越多,函数逐渐添加到图中。在更新期间,图的顶部有一个进度指示器,显示已经绘制了多少数据。在情节完成之前的更新期间支持缩放和平移。金宝app

散射(T.ArrDelay T.DepDelay)包含(“延误”) ylabel (离职的延迟) xlim([-140 1000])

图中包含一个轴对象。坐标轴对象包含一个散点类型的对象。

进度条还包括暂停/恢复按钮。一旦显示了足够的数据,使用该按钮可以提前停止绘图更新。

拟合趋势线

使用polyfit而且polyval函数在到达和离开延误的图上叠加线性趋势线。

持有p = polyfit(T.ArrDelay,T.DepDelay,1);x = sort(T.ArrDelay,1);Yp = polyval(p,x);情节(x, yp,的r -)举行

图中包含一个轴对象。坐标轴对象包含2个散点、直线类型的对象。

可视化密度

点的散点图在一定程度上是有用的,但如果点大量重叠,则很难从图中破译信息。在这种情况下,它有助于可视化图中点的密度,以发现趋势。

使用binscatter函数可视化到达和起飞延误图中点的密度。

binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”,[-100 1000]) xlim([-100 1000])“延误”) ylabel (离职的延迟

图中包含一个轴对象。axis对象包含一个类型为binscatter的对象。

调整这一属性,以便所有大于150的bin值具有相同的颜色。这可以防止一些值非常大的箱子控制情节。

Ax = gca;斧子。CLim = [0 150];

图中包含一个轴对象。axis对象包含一个类型为binscatter的对象。

另请参阅

||

相关的话题