mapreduce
用于分析内存中不能容纳的数据集的编程技术
语法
描述
例子
输入参数
输出参数
提示
调试
mapreduce
检查键值对如何通过不同阶段移动的算法总是有用的。要检查数据的移动,请在映射和reduce函数中设置断点。的执行停止mapreduce
,允许您检查相关变量的当前状态,如KeyValueStore
或ValueIterator
.有关详细信息,请参见调试MapReduce算法.一些优化建议
mapreduce
在任何平台上的性能是:最小化对map函数的调用次数。最简单的方法是增加
ReadSize
属性的值。结果是mapreduce
将更大的数据块传递给map函数,数据存储会因更少的读取而耗尽。减少map和reduce函数之间发送的中间数据量。一种方法是使用
独特的
在map函数中组合类似的键。看到使用MapReduce按组计算平均值这是这个技术的一个例子。
扩展功能
另请参阅
介绍了R2014b