主要内容

可视化高大的数组

大型数据集可视化要求数据总结,扔进垃圾箱,或者在某种程度上减少采样点,绘制在屏幕上。在某些情况下,等功能柱状图本数据规模减少,而其他等功能情节散射使用一种更复杂的方法,避免了策划复制像素在屏幕上。问题的像素重叠的相关分析binscatter密度函数还提供了一个有效的方法来可视化模式。

可视化高数组并需要使用收集。MATLAB®立即评估和显示的可视化高数组。目前,你可以想象高数组使用这个表中的函数和方法。

函数 需要工具箱 笔记
情节 - - - - - -

这些函数的阴谋在迭代,逐步增加情节读取更多的数据。在更新期间,一个进度指示器显示数据的比例绘制。支持缩放和移动在更新过程中,阴谋之前完成。金宝app停止更新过程,按进度指示器的暂停按钮。

散射 - - - - - -
binscatter - - - - - -
柱状图 - - - - - -
histogram2 - - - - - -
- - - - - -

分类数据的可视化。

binScatterPlot(统计和机器学习的工具箱) 统计和机器学习的工具箱™

图包含一个滑动条来控制亮度和颜色在图像细节。滑块调整的价值γ图像校正参数。

ksdensity(统计和机器学习的工具箱) 统计和机器学习工具

产生一个概率密度估计的数据,在100点处的单变量数据,为二元数据或900点。

datasample(统计和机器学习的工具箱) 统计和机器学习工具

datasample使您能够提取的子样品高数组统计声音的方式相比,简单的索引。如果数据的子集是足够小,适合在内存中,然后您可以使用绘图和拟合函数不直接支持高数组的子集。金宝app

高数组绘制的例子

这个例子展示了几种不同的方式你可以想象高数组。

创建一个数据存储airlinesmall.csv数据集,其中包含行航空飞行数据。选择表的一个子集变量处理,去除含有缺失值的行。

ds = tabularTextDatastore (“airlinesmall.csv”,“TreatAsMissing”,“NA”);ds。SelectedVariableNames = {“年”,“月”,“ArrDelay”,“DepDelay”,“起源”,“桌子”};T =高(ds);T = rmmissing (T)
T = Mx6高表年月ArrDelay DepDelay起源Dest ___ _____说____ ____ 1987 10 8 12{“宽松”}{‘SJC} 1987年10 8 1 {‘SJC}{“钻”}1987年10 21 20{‘圣’}{SMF的}1987年10 13 12{“钻”}{‘SJC} 1987年10 4 1 {SMF的}{“宽松”}59 1987 63{“宽松”}{‘SJC} 1987年10 3 2{‘圣’}{“旧金山”}1987年10 11 1{‘海’}{“宽松”}::::::::::::

饼图的航班

把数字变量的类别变量反映了月的名字。然后画一个饼图显示有多少航班每个月的数据。

T。月=分类(T.Month 1:12, {“1月”,2月的,“3”,4月的,“可能”,“君”,“7”,“8月”,“9”,“10月”,11月的,12月的})
T = Mx6高表年月ArrDelay DepDelay起源Dest ___ _____说____ ____ 1987 10月8 12{“宽松”}{‘SJC} 1987年10月8日1 {‘SJC}{“钻”}1987年10月21日20{‘圣’}{SMF的}1987年10月13日12{“钻”}{‘SJC} 1987 10月4 1 {SMF的}{“宽松”}1987 10月59 63{“宽松”}{‘SJC} 1987 10月3 2{‘圣’}{“旧金山”}1987年10月11日1{‘海’}{“宽松”}::::::::::::
派(T.Month)
评估高表达式使用当地的MATLAB会话:通过1 2:在1.3秒完成,通过2 2:在1秒完成评估在3.1秒完成

延迟的柱状图

画一个柱状图到达每个航班延误的数据。由于数据有一个长尾,限制策划区域使用BinLimits名称-值对。

直方图(T.ArrDelay“BinLimits”150年[-50])
评估高表达式使用当地的MATLAB会话:通过1 2:在2.3秒完成,通过2 2:在0.86秒完成评估在3.9秒完成

图包含一个坐标轴对象。坐标轴对象包含一个直方图类型的对象。

散点图的延迟

绘制散点图的抵达和起飞延误。你可以预期很强的相关性之间的这些变量,因为航班离开晚了也有可能迟到。

当高层数组操作,情节,散射,binscatter功能图中的数据迭代,逐步增加情节读取更多的数据。在情节的顶部有一个更新进度指示器显示多少数据被绘制。支持缩放和移动在更新之前的情节就完成了。金宝app

散射(T.ArrDelay T.DepDelay)包含(“延误”)ylabel (离职的延迟)xlim(1000年[-140])ylim (1000 [-140])

图包含一个坐标轴对象。坐标轴对象包含一个散射类型的对象。

进度条还包括一个暂停/恢复按钮。使用按钮停止情节更新早期一旦足够的数据显示。

健康趋势线

使用polyfitpolyval功能覆盖一个线性趋势线抵达和起飞延误的情节。

持有p = polyfit (T.ArrDelay T.DepDelay 1);x = (T.ArrDelay, 1);yp = polyval (p (x);情节(x, yp,的r -)举行

图包含一个坐标轴对象。坐标轴对象包含2散射类型的对象,线。

可视化密度

散点图的点会在一定程度上是有用的,但它很难破译的信息如果点重叠广泛的阴谋。在这种情况下,它有助于形象化的密度点阴谋趋势。

使用binscatter函数可视化的密度点的情节抵达和起飞延误。

binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”1000年[-100])xlim (1000 [-100]) ylim([-100 1000])包含(“延误”)ylabel (离职的延迟)

图包含一个坐标轴对象。坐标轴binscatter类型的对象包含一个对象。

调整这一财产的轴,这样所有本值大于150颜色相同。这可以防止几箱非常大的价值观支配的阴谋。

甘氨胆酸ax =;斧子。这一= [0 150];

图包含一个坐标轴对象。坐标轴binscatter类型的对象包含一个对象。

另请参阅

||

相关的话题