主要内容

高阵列的可视化

可视化大数据集要求以某种方式汇总,收集或采样数据以减少屏幕上绘制的点数。在某些情况下,诸如直方图馅饼装箱数据以减少大小,而其他功能如情节分散使用更复杂的方法,避免在屏幕上绘制重复的像素。对于像素重叠与分析相关的问题,则binscatter功能还提供可视化密度模式的有效方法。

可视化的高数组可以需要使用收集。MATLAB®立即计算并显示长数组的可视化。目前,您可以使用这个表中的函数和方法来可视化高数组。

功能 需要工具箱 笔记
情节 - - - - - -

这些函数在迭代中绘制图形,随着读取更多数据,逐步添加到图形中。在更新期间,一个进度指示器显示已绘制的数据的比例。在情节完成之前的更新过程中支持缩放和平移。金宝app如果要停止更新过程,请按进度指示灯中的暂停键。

分散 - - - - - -
binscatter - - - - - -
直方图 - - - - - -
histogram2 - - - - - -
馅饼 - - - - - -

仅用于可视化分类数据。

binscatterplot.(统计和机器学习工具箱) 统计和机器学习工具箱™

图中包含一个滑块来控制图像中的亮度和颜色细节。控件的值被滑块调整伽玛图像校正参数。

ksdity.(统计和机器学习工具箱) 统计和机器学习工具箱

生成数据的概率密度估计值,单变量数据为100点,双变量数据为900点。

datasample(统计和机器学习工具箱) 统计和机器学习工具箱

datasample与简单索引相比,使您能够以统计上合理的方式提取高数组的子样本。如果数据子集足够小,可以装入内存,那么可以在不直接支持高数组的子集上使用绘图和拟合函数。金宝app

高阵列绘图示例

此示例显示了几种不同的方式,即可显示高阵列。

创建一个数据存储区Airlinesmall.csv.数据集,其中包含航空公司航班数据行。选择要处理的表变量子集,并删除包含缺失值的行。

ds = tabularTextDatastore ('airlinesmall.csv',“TreatAsMissing”,'na');ds.selectedvariablenames = {“年”,“月”,'arrdelay',“DepDelay”,'起源','ide'};T =高(ds);T = rmmissing (T)
T = Mx6高表年月ArrDelay DepDelay起源服务台  ____ _____ ________ ________ _______ _______ 1987年10 8 12{“宽松”}{‘SJC} 1987年10 8 1{‘SJC}{“钻”}1987年10 21 20{‘圣’}{SMF的}1987年10 13 12{“钻”}{‘SJC} 1987年10 4 1 {SMF的}{“宽松”}59 1987 63{“宽松”}{‘SJC} 1987年10 3 2{‘圣’}{“旧金山”}1987年10 11 1{‘海’}{松懈 '} : : : : :: : : : : : :

航班饼图逐个月

把数字变量转换为反映月份名称的分类变量。然后绘制一个饼图,显示每年每个月的数据中有多少航班。

T.Month =分类(T。月,1:12,{'1月','2月',“3”,'APR',“可能”,“君”,“7”,“8月”,“9”,'OCT',11月的,'Dec'})
T = MX6高表年份arrdelay depdelay orign dest _______________________________________________________________ 1987 10月12日{'sjc'} 1987年10月8 1'san'} {'smf'} 1987年10月13日{'bur'} {'sjc'} 1987年10月4日-1 {'smf'} {'lax'} 1987年10月59 63 {'lax'} {sjc'} 1987年10月3日-2 {'SAN'} {'SFO'} 1987年10月11日-1 {'Sea'} ::::::::::::::::::::::::::
派(T.Month)
使用当地MATLAB会话评估高表达: - 通过第1条:第2条:在1.5秒内完成 - 通过2的第2条:在1.2秒评估中完成3.4秒

延迟的柱状图

在数据中绘制每个航班到达延误的直方图。由于数据有一个长尾,使用BinLimits名称-值对。

直方图(T。ArrDelay,'binlimits'150年[-50])
使用本地MATLAB会话评估高表达式:-通过2中的1:在2.8秒完成-通过2中的2:在1.1秒完成评估在4.7秒完成

图中包含一个轴。轴包含类型直方图的对象。

延迟延迟

绘制到达和离开延误的散点图。你可以预期这些变量之间有很强的相关性,因为起飞晚的航班也可能晚点到达。

当操作高数组时情节,分散, 和binscatter函数绘制迭代中的数据,随着读取更多数据,逐渐添加到曲线。在更新期间,绘图的顶部有一个进度指示符,显示绘制了多少数据。在绘图完成之前,在更新期间支持缩放和平移。金宝app

散射(T.Arrdelay,T.Depdelay)Xlabel('抵达延迟')ylabel(离职的延迟)XLIM([ -  140 1000])ylim([ -  140 1000])

图中包含一个轴。轴包含类型散射的对象。

进度条还包括暂停/恢复按钮。使用按钮可提前停止绘图更新一次。

适合趋势线

使用polyfit多尔功能是在到达和离开延误图上叠加一条线性趋势线。

持有p = polyfit(t.arrdelay,t.depdelay,1);x =排序(t.Arrdelay,1);yp = polyval(p,x);绘图(x,yp,的r -) 抓住离开

图中包含一个轴。轴包含2个类型的散射,线。

可视化密度

点的散点图是有用的一定程度,但如果点广泛重叠,则可以很难从绘图中解密信息。在这种情况下,它有助于可视化绘图中的点密度到现货趋势。

使用binscatter功能可视化到达和出发延迟情节中的点密度。

binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”,[ -  100 1000])XLIM([ -  100 1000])ylim([ -  100 1000])Xlabel('抵达延迟')ylabel(离职的延迟)

图中包含一个轴。轴包含一个binscatter类型的对象。

调整clim轴的属性使得大于150的所有bin值都是相同的。这可以防止几个垃圾箱从统治绘图中取出非常大的值。

斧头= GCA;ax.clim = [0 150];

图中包含一个轴。轴包含一个binscatter类型的对象。

另请参阅

||

相关话题