可视化高大的数组
大型数据集可视化要求数据总结,扔进垃圾箱,或者在某种程度上减少采样点,绘制在屏幕上。在某些情况下,等功能柱状图
和派
本数据规模减少,而其他等功能情节
和散射
使用一种更复杂的方法,避免了策划复制像素在屏幕上。问题的像素重叠的相关分析binscatter
密度函数还提供了一个有效的方法来可视化模式。
可视化高数组并不需要使用收集
。MATLAB®立即评估和显示的可视化高数组。目前,你可以想象高数组使用这个表中的函数和方法。
函数 | 需要工具箱 | 笔记 |
---|---|---|
情节 |
- - - - - - | 这些函数的阴谋在迭代,逐步增加情节读取更多的数据。在更新期间,一个进度指示器显示数据的比例绘制。支持缩放和移动在更新过程中,阴谋之前完成。金宝app停止更新过程,按进度指示器的暂停按钮。 |
散射 |
- - - - - - | |
binscatter |
- - - - - - | |
柱状图 |
- - - - - - | |
histogram2 |
- - - - - - | |
派 |
- - - - - - | 分类数据的可视化。 |
binScatterPlot (统计和机器学习的工具箱) |
统计和机器学习的工具箱™ | 图包含一个滑动条来控制亮度和颜色在图像细节。滑块调整的价值 |
ksdensity (统计和机器学习的工具箱) |
统计和机器学习工具 | 产生一个概率密度估计的数据,在100点处的单变量数据,为二元数据或900点。 |
datasample (统计和机器学习的工具箱) |
统计和机器学习工具 |
|
高数组绘制的例子
这个例子展示了几种不同的方式你可以想象高数组。
创建一个数据存储airlinesmall.csv
数据集,其中包含行航空飞行数据。选择表的一个子集变量处理,去除含有缺失值的行。
ds = tabularTextDatastore (“airlinesmall.csv”,“TreatAsMissing”,“NA”);ds。SelectedVariableNames = {“年”,“月”,“ArrDelay”,“DepDelay”,“起源”,“桌子”};T =高(ds);T = rmmissing (T)
T = Mx6高表年月ArrDelay DepDelay起源Dest ___ _____说____ ____ 1987 10 8 12{“宽松”}{‘SJC} 1987年10 8 1 {‘SJC}{“钻”}1987年10 21 20{‘圣’}{SMF的}1987年10 13 12{“钻”}{‘SJC} 1987年10 4 1 {SMF的}{“宽松”}59 1987 63{“宽松”}{‘SJC} 1987年10 3 2{‘圣’}{“旧金山”}1987年10 11 1{‘海’}{“宽松”}::::::::::::
饼图的航班
把数字月
变量的类别变量反映了月的名字。然后画一个饼图显示有多少航班每个月的数据。
T。月=分类(T.Month 1:12, {“1月”,2月的,“3”,4月的,“可能”,“君”,“7”,“8月”,“9”,“10月”,11月的,12月的})
T = Mx6高表年月ArrDelay DepDelay起源Dest ___ _____说____ ____ 1987 10月8 12{“宽松”}{‘SJC} 1987年10月8日1 {‘SJC}{“钻”}1987年10月21日20{‘圣’}{SMF的}1987年10月13日12{“钻”}{‘SJC} 1987 10月4 1 {SMF的}{“宽松”}1987 10月59 63{“宽松”}{‘SJC} 1987 10月3 2{‘圣’}{“旧金山”}1987年10月11日1{‘海’}{“宽松”}::::::::::::
派(T.Month)
评估高表达式使用当地的MATLAB会话:通过1 2:在1.3秒完成,通过2 2:在1秒完成评估在3.1秒完成
延迟的柱状图
画一个柱状图到达每个航班延误的数据。由于数据有一个长尾,限制策划区域使用BinLimits
名称-值对。
直方图(T.ArrDelay“BinLimits”150年[-50])
评估高表达式使用当地的MATLAB会话:通过1 2:在2.3秒完成,通过2 2:在0.86秒完成评估在3.9秒完成
散点图的延迟
绘制散点图的抵达和起飞延误。你可以预期很强的相关性之间的这些变量,因为航班离开晚了也有可能迟到。
当高层数组操作,情节
,散射
,binscatter
功能图中的数据迭代,逐步增加情节读取更多的数据。在情节的顶部有一个更新进度指示器显示多少数据被绘制。支持缩放和移动在更新之前的情节就完成了。金宝app
散射(T.ArrDelay T.DepDelay)包含(“延误”)ylabel (离职的延迟)xlim(1000年[-140])ylim (1000 [-140])
进度条还包括一个暂停/恢复按钮。使用按钮停止情节更新早期一旦足够的数据显示。
健康趋势线
使用polyfit
和polyval
功能覆盖一个线性趋势线抵达和起飞延误的情节。
持有在p = polyfit (T.ArrDelay T.DepDelay 1);x = (T.ArrDelay, 1);yp = polyval (p (x);情节(x, yp,的r -)举行从
可视化密度
散点图的点会在一定程度上是有用的,但它很难破译的信息如果点重叠广泛的阴谋。在这种情况下,它有助于形象化的密度点阴谋趋势。
使用binscatter
函数可视化的密度点的情节抵达和起飞延误。
binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”1000年[-100])xlim (1000 [-100]) ylim([-100 1000])包含(“延误”)ylabel (离职的延迟)
调整这一
财产的轴,这样所有本值大于150颜色相同。这可以防止几箱非常大的价值观支配的阴谋。
甘氨胆酸ax =;斧子。这一= [0 150];